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(54) Title: HUMAN DEFENSIN DEF-X, GENE AND DNAc, COMPOSITION CONTAINING SAME AND DIAGNOSTIC ANI^ 
THERAPEUTIC APPLICATIONS 

(54) Titrc: DEFENSINE HUMAINE DEF-X, GENE ET cDNA, COMPOSITION LES CONTENANT ET APPLICATIONS AU 
DIAGNOSTIC ET A LA THERAPIE 

(57) Abstract 

The invention concerns a novel human polypeptide defensin, homologous of HNP-4, its genomic DNA and DNAc, vectors, cells 
transformed by said vectors, the use of said polypeptide as antibiotic, cytotoxic, repairing and endocrine regulating agent or as pesticide 
as well as cosmetic or pharmaceutical compositions for treating microbial infections, in particular bacterial, fungal, and viral, or parasitic, 
cancers, inflammation and immunodeficiency. The invention also concerns diagnostic methods and kits for determining a microbial or 
parasitic infection and an inflammation, or for detecting predisposition to immunodeficiency or cancerous diseases. 

(57) Abreg£ 

La pnSsente invention conceme une nouvelle defensine polypeptidique humaine Def-X, homologue de V HNP-4, son ADN g6nomique 
et ADNc, des vecteurs, des cellules transformees par lesdits vecteurs, rutilisation dudit polypeptide comme agent antibiotique, cytotoxique, 
de reparation et de regulation endocrine ou comme pesticide ainsi que des compositions cosmdtiques ou pharmaceutiques pour le traitement 
des infections microbiennes, notamment bacteriennes, fongiques,.et virales, ou parasitaires, de cancers, de Y inflammation et de deficit 
immunitaire. L* invention conceme egalement des m6thodes et des kits de diagnostic pour la determination d'une infection microbienne ou 
paras itai re et d'une'infi animation, ou pour le depistage de predisposition a des d6ficiences immunitaires ou des maladies cancereuses. 



VN1QUEMENT A TITRE D 'INFORMATION 



Codes utilises pour identifier les Etats parties au PCT, sur les pages de couverture des brochures publiant des demandes 
intemationales en vertu du PCT. 



AU 


Albanie 


ES 


Espagne 


LS 


Lesotho 


SI 


Slovenie 


AM 


Arm erne 


FI 


Finlande 


LT 


Lituanie 


SK 


Slovaquie 


AT 


Autriche 


FR 


France 


LU 


Luxembourg 


SN 


SCndgal 


AU 


Ausiralie 


GA 


Gabon 


LV 


Lettonie 


SZ 


Swaziland 


AZ 


Azerbaijan 


GB 


Royaume-Uni 


MC 


Monaco 


TD 


Tchad 


BA 


Bosnie-Herzegovine 


GE 


Georgie 


MD 


Rdpublique de Moldova 


TG 


Togo 


BB 


Barbade 


GH 


Ghana 


MG 


Madagascar 


TJ 


Tadjikistan 


BE 


Belgique 


GN 


Guinfce 


MK 


Ex-Republique yougoslave 


TM 


Turkmenistan 


BF 


Burkina Faso 


GR 


Grece 




de Macddoine 


TR 


Turquie 


BG 


Bulgarie 


HU 


Hongne 


ML 


Mali 


TT 


Trinit£-et-Tobago 


BJ 


Benin 


IE 


Irlande 


MN 


Mongolie 


DA 


Ukraine 


BR 


Brdsil 


IL 


Israel 


MR 


Mauri tan ie 


UG 


Ouganda 


BY 


B61ams 


IS 


Islande 


MW 


Malawi 


US 


Etats-Unis d'Amdrique 


CA 


Canada 


IT 


lialie 


MX 


Mexique 


UZ 


Ouzbdkistan 


CF 


R6publiquc cenirafricaine 


JP 


Japon 


NE 


Niger 


VN 


Viet Nam 


CG 


Congo 


KE 


Kenya 


NL 


Pays-Bas 


YU 


Yougoslavie 


CH 


Suisse 


KG 


Kirghizisian 


NO 


Norvege 


ZW 


Zimbabwe 


CI 


Cote d'lvoire 


KP 


R6publique populaire 


NZ 


Nouvelle-Ze'lande 






CM 


Cameroun 




democrauque de Coree 


PL 


Pologne 






CN 


Chine 


ICR 


Republique de Corte 


PT 


Portugal 






cu 


Cuba 


KZ 


Kazakstan 


RO 


Roumanie 






cz 


Rdpublique icheque 


LC 


Saime-Lucie 


RU 


Fddfiration de Russie 






DE 


Allemagne 


U 


Liechtenstein 


SD 


Soudan 






DK 


Dan em ark 


LK 


Sri Lanka 


SE 


Suede 






EC 


Estonie 


LR 


LiWria 


SG 


Singapour 







nwcnnrin- ^wn qohwwai i •> 



» 



WO 99/1 1 663 PCT/FR98/01 864 



DEFENSINE HUMAJNE DEF-X, GENE ET cDNA, COMPOSITION LES CONTENANT ET APPLICATIONS AU 
DIAGNOSTIC ET A LA THERAPIE 

La prcscntc invention conccrnc .unc nouvcllc defensine polypcptidiquc 
5 humainc Def-X, homologuc de 1TINP-4, son ADN genomique ct ADNc. 

L'invcntion concerne egaicment des vectcurs dc cionagc ct d'exprcssion, des 
cellules transformees par lesdits vectcurs. L'invention a aussi pour objet Tuiilisation 
desdits polypeptides comme agent antibiotique, cytotoxiquc, de reparation ci de 
regulation endocrine ou comme pesticide ainsi que des compositions cosmetiques ou 
10 pharmaceutiques pour le traitement des infections microbiennes, notammeni 
bacteriennes, fongiques, et virales, ou parasitaires, de cancers, de rinflammation et de 
deficit immunitaire. Enfin, 1'invention comprend des methodes et des kits de diagnostic 
pour la determination d'une infection microbienne ou parasitaire et d'unc inflammation, 
ou pour le depistage de predisposition a des deficiences immunitaires ou des maladies 
15 cancereuses. 

Les substances antimicrobiennes sont des elements primordiaux de la 
defense des organismes multiceliulaircs. Parmi ces substances, on trouve aussi bicn des 
composes inorganiques simples (pcroxyde d'hydrogene, acidc hypochlorcux, oxydc 
nitrique) que des peptides et proteines complexes, lis sont presents sur les premieres 
20 ligncs de defense, a la surface des muqueuses de differcnts organcs, notamment dans les 
cellules epitheliales de l'intestin et des poumons, selon les especes, ainsi que dans les 
organelles microbicides des cellules phagocytaires d'origine hematopoietique. ou ils 
ftirent tout d ! abord mis en evidence. Leur synthese de novo ou leur liberation a panir dc 
sites de stockage - organelles de type lysosomes, granules cytoplasmiques, capables de 
25 les stocker sous une forme inactive ou latente - peuvent etre induites .rapidement, ce qui 
les rend particulierement importants dans les phases precoces de resistance aux 
infections (Martin et al., 1995). 

Les proteines antimicrobiennes d'une taille inferieure a cent acides amines 
sont arbitrairement appelees peptides antimicrobiens. Plusieurs families de peptides 
30 antimicrobiens ont ete identifies, qui different quant k la presence en leur sein de ponts 
disulfures, quant a leur composition en acides amines, a leur conformation structurelle et 
a leur spectre d'activite. Les peptides antimicrobiens comportant six cysteines 
conservees forment la famille des defensines. Cette famille est composee de peptides 
antimicrobiens presents dans de nombreuses especes, abondants, d'environ 3-4 kDa 
35 (Ganz et Lehrer, 1994). Ces peptides sont formes de 30 a 40 acides amines, dont six 
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cysteines invariantes qui forment trois liens disulfides intramcleculaires. lis ont unc 
conformation complexe, sont amphipathiqucs, riches en fcuillcts beta anti-paralleles, 
mais depourvus d'hcliccs alpha (Lchrer ct Ganz, 1992). faction antimicrobienne des 
defensines resultcrait dc leur insertion dans les membranes des cellules cibles, 
5 pcrmettant la formation dc canaux voltage-dependants. White ct al. (1995) decrivent les 
mccanismcs possibles d'insertion mcmbranaire ct dc formation dc pores multimcriqucs 
par les defensines, qui pcrmettent la pcrmcabilisation des membranes des cellules cibles, 
par exemple des cellules microbiennes ou tumoralcs. La structure cristallographique dc 
la defensine humaine de neutrophile HNP-3 (voir ci-dessous) a ete deterniinee, et un 
10 mccanisme particulier de dimerisation des defensines humaines de neutrophile est en 
outre suggere. La connaissance elargie de cette famille de peptides et la comparaison de 
leurs sequences et spectres d'activite permettront dc mieux comprendre ces mecanismes 
et leurs specificites, ainsi que les residus acides amines plus particulierement impliques 
dans ces phenomenes. 

15 Les defensines se repartissent en trois families de peptides, structurellemcnt 

differents : les defensines "classiqucs", les beta-defensines et les defensines des inscctes. 
Ces families presentent des differences conccrnant la position et l'espacemcnt des 
residus cysteines conserves, ainsi que ccux d'autrcs acides amines conserves (proline, 
glycine) (Ganz et Lehrer, 1995). 
20 Les defensines humaines, dc type classiquc, proviennent essentieUcmcnt dc 

deux sources. Elles ont d'abord ete identifiees par purification peptidiquc a partir 
d'extraits de neutrophiles. Quatre defensines ont ainsi ete isolees: "human neutrophil 
peptides" HNP-1, HNP-2, HNP-3, et HNP-4. Les trois premieres sont des produits 
differents du meme gene (Ganz et Lehrer, 1995). Ces trois peptides representent 99 % 
25 du contenu des neutrophiles en defensines, alors que HNP-4 y est aussi present, mais a 
des concentrations 100 fois plus faibles. Plus recemment, deux defensines enteriques 
humaines, HD-5 et HD-6, ont €t€ caracterisees dans I'intestin grele et plus precisement 
dans les cellules de Paneth (Bevins et al., 1996). Alors que 16 genes de defensines 
enteriques ont ete mis en evidence chez la souris, seuls ces deux homologues ont etc 
30 identifies chez I'homme (Mallow et al., 1996). 

Les defensines ont une action antimicrobienne sur un large spectre dc 
microorganismes in vitro (Martin et al., 1995). Ce spectre d'action, particulierement 
large, comprend des bacteries, Gram-positives et Gram-negatives, plusieurs 
champignons, des mycobacteries, des parasites dont les spirochetes et plusieurs virus a 
35 enveloppe dont les virus HSV et HIV. Elles sont egalement cytotoxiques pour plusieurs 
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categories de cellules normales et malignes, dont les cellules resistantcs au TNF-alpha et 
au facteur cytolytique NK (Kagan et al., 1994). La grandc quantite dc ciblcs des 
defensines et leur abondancc dans les cellules sanguines specialises dans la defense 
immunitaire, ainsi que ['augmentation dramatiquc de leur concentration an cours. 
5 d'infections scveres, suggcrent que ccs molecules joucraicnt un role important dans 
Pimmunitc naturcllc aux infections et aux cancers. Notammcnt, ('augmentation de la 
transcription des genes des defensines et la liberation de granules cytoplasmiques 
contenant des defensines pre-synthctisces en reponse a des stimuli, contribuent a la 
reponse antimicrobienne locale, les defensines pouvant participer a la reaction 
.10 d'infiammation, aux processus de reparation et a la regulation endocrine pendant 
Tinfection. Les defensines hematopoictiqucs pourraient contribuer au phenomenc dc lyse 
des cellules cancereuses, phenomene medie par les neutrophiles au cours de la reponse 
immunitaire anticorps-dependante. Le role physiologique precis des defensines 
enteriques n'est pas clairement etabli. Elles pourraient endiguer la proliferation de la 
15 flore intraluminale ou empecher la translocation de bacteries a travers la muqueuse 
intestinale (Mallow et al., 1996). L'abondance de I'ARNm de defensine dans les cellules 
de Paneth renforce I'hypothese que ccs cellules cpithelialcs joueraient un role clc dans la 
defense immunitaire dc l'intestin. 11 a par ailleurs etc montre que leur schema 
depression coincide avec l'apparition des cellules dc Paneth au cours dc 
20 l'embryogencse. Mallow et al. (1996) ont suggcrc que de faiblcs taux .^expression dc 
defensines enteriques chez le foetus serait le tcmoin d'unc immaturite de la defense 
locale, ce qui predisposerait les enfants nes prematurement a des infections dues aux 
microorganismes intestinaux. 

Une concentration des defensines correspondant a 10 % du taux normal est 
25 constatee chez des patients atteints de "specific granule deficiency", une maladie rare du 
diveloppement des granulocytes. Les sujets atteints souffrent d'infections frequentes, 
provoquees par des bacteries communes (Ganz et Lehrer, 1995). 

Les defensines modifiees biochimiquement sont de potentiels agents 
prophylactiques et th6rapeutiques contre les infections (Ganz et Lehrer, 1995). La 
30 recherche concernant ces peptides antimicrobiens ou d'autres molecules participant de 
l'immunite naturelle, acquiert une importance particuliere depuis que se developpent des 
phenomenes de resistance des microorganismes aux antibiotiques traditionnels (Bevins 
etal., 1996). 

La structure primaire de defensines, notamment des defensines humaines, a 
35 fait l'objet d'etudes recentes (White et al., 1995 ; Mallow et aL 1996). Les defensines 
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classiques comprennent 29 a 35 acidcs amines, mais derivent de precurseurs - 
preproproteines - comprenant 90 a 100 acides amines. La maturation proteolytique des 
defensines humaines de neutrophilcs en peptides matures est couplec avec leur adrcssagc 
vers les granulocytes ; la fonction du propeptide inclurait I'inactivation dc la forme 
5 prccurscur de la defensinc ct un support a r acquisition dc la conformation active du 
peptide mature (Martin et al., 1995). Les homologies peptidiqucs sont maximalcs au 
niveau des signaux peptides, ct minimalcs au niveau des peptides matures, qui 
component neanmoins six rdsidus cysteines totaiement conserves. Si la conservation de 
ces residus semble necessaire a P acquisition de structures secondares impliquees dans 

10 Tactivite des defensines, les differences de sequences existant au sein de la tres large 
famille de ces peptides antimicrobiens, notammenl a leur extremitc N-terminalc, mais 
aussi dans d'autres regions non conscrvees, semblent etre des determinants importants 
de leur spectre d'activite, et de leur efficacite antimicrobienne ou cytotoxique. 
L' identification de nouveaux membres de cette famille de peptides, et notamment de 

15 defensines humaines, est done necessaire a la comprehension de leur rnecanismc 
d'action et de leur specificite, ainsi qu'a leur utilisation comme agents anti-infectieux 
et/ou cytotoxiques, ou au dessin de peptides variants presentant des spectres specifiques 
et/ou d'cfficacite diminuee ou augmcntee. 

Sparkes et al. (1989), ont localise le gene codant pour HNP-1 sur Ic 

20 chromosome 8, dans la region 8p23. Bcvins ct al. (1995), ct Mallow et al. (1996), ont 
localise les deux genes codant pour HD-5 et HD-6 sur le chromosome 8, plus 
precisement dans la region 8p21-pter, region incluant la region precedemmcnt identifiee 
comme portant les defensines hematopoietiques. Les genes codant pour les defensines 
enteriques humaines HD-5 et HD-6 contiennent deux exons, alors que ceux codant pour 

25 les defensines hematopoidtiques en contiennent trois, les deux derniers exons codant 
pour le pr6propeptide, aussi bien chez Thomme, que chez le cobaye et le lapin (Mallow 
et al., 1996). La comparaison des sequences genomiques des genes HD-5 et HD-6 a 
revile une tres forte similarite des sequences flanquantes non codantes en 5', suggerant 
que celles-ci contiennent Tinformation necessaire a la tissu-specificite de Texpression de 

30 ces genes; ces memes regions portent en outre de nombreux sites de fixation pour des 
facteurs de transcription, dont deux sites AP2 et six sites 1L6, suggerant des voies de 
regulation de l'expression de ces genes au cours des processus inflammatoires. De fa<?on 
plus generale, le tres important degre de similarite des sequences et de l'organisation 
genomique des defensines HNP-1, 2, 3, 4 et HD-5 et 6, a conduit Bevins et al. (1995) a 
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un modele devolution tentant de relatcr ('organisation chromosomique de la Famillc, el 
les fractions homologues dc chaque paire dc genes. 

II est enfin intcrcssant dc notcr que la region chromosomique 8p23 est 
impliquec dans dc nombrcuscs pathologies, notammcnt cancercuscs : on citcra par 
5 excmplc Ic carcinomc hepatocellulaire (Decker ct al., 1996), le cancer du poumon non a 
petites cellules (Sundarcshan ct Augustus, 1996), le cancer de la prostate (lchikawa ct 
al., 1996), ct !e carcinomc colorectal (Yarcmko ct al., 1994). Bien que ccci n'ait jamais 
ete documente, il est possible qu'une deficience en Tunc ou Pautrc des defensincs 
humaincs ait un role dans la predisposition a de telles pathologies, ou dans leur 
10 developpement. 

La presente invention concernc unc nouvellc defensinc humainc, Def-X, 
homologue de la defensine HNP-4. 

La presente invention a done pour objet un polypeptide isole choisi parmi les 
polypeptides suivants : 
15 a) polypeptide dont la sequence d'acides amines est la sequence SEQ ID N° 3 ; 

b) polypeptide homologue, variant, ou modifie du polypeptide dont la sequence 
d'acides amines est la sequence SEQ ID N° 3 ; 

c) polypeptide dont la sequence d'acides amines est la sequence d'acides amines d'un 
fragment biologiquemcnt actif d'un polypeptide tel que defini en a) ou b) ; 

20 d) polypeptide comprenant au moins un fragment tel que defini en c). 

Dans la presente description, on entendra designer cgalcment par 
« polypeptide » une proteine ou un peptide 

Selon un mode prefere, le polypeptide selon V invention est caracterise en ce 
qu'il est constitu6 de Tun au moins des fragments suivants : 
25 a) peptide signal dont la sequence d'acides amines est la sequence SEQ ID N° 4, 
correspondant a la sequence comprise entre la position 1 et la position 19, 
extremites comprises, de la sequence d'acides amines SEQ ID N° 3 ; 

b) region pro dont la sequence d'acides amines est la sequence SEQ ID N° 5, 
correspondant a la sequence comprise entre la position 20 et la position 63, 

30 extremites incluses, de la sequence d'acides amines SEQ ID N° 3 ; 

c) peptide mature dont la sequence d'acides amines est la sequence SEQ ID N° 6, 
correspondant a la sequence comprise entre la position 64 et la position 94, 
extremites incluses, de la sequence decides amines SEQ ID N° 3 ; ou 

d) fragment homologue, variant ou modifie d'un peptide selon a), b) ou c). 
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Dc fapon encore preferee, les polypeptides selon la prcsenie invention 
correspondent a la stmcture primaire de la defensinc mature defmic prcccdcmmcnl, 
e'est-a-dire la stmcture correspondant a la sequences d'acides amines SEQ ID N° 6 
suivantc : 

5 He Cys His Cys Arg Val Leu Tyr Cys He Phc Gly Glu His Leu Gly Gly Thr Cys 

Phc He Leu Gly Glu Arg Tyr Pro He Cys Cys Tyr. 
scs homologues, variants ou formes modifiecs ainsi que leurs fragments biologiquement 
actifs et les polypeptides les contenant. 

11 est bien entendu que les polypeptides de P invention sont sous forme non 
10 naturelle, e'est-a-dire qu'ils ne sont pas pris dans leur environnement nature! mais qu'ils 
ont pu etrc obtenus par purification a partir dc sources naturelles ou bien obtcnus par 
recombinaison genetique ou par synthese chimique comme cela sera decrit ci-apres. 

Par « polypeptide homologue », on emend un polypeptide dont la sequence 
d'acides amines presente au minimum 80 %, ct prefercntiellemcnt 90 %, d'acides 
15 amines en commun. 

Par « polypeptide variant », on entend designer un polypeptide mute ou 
correspondant a un polymorphismc pouvant cxistcr, notamment chez Tetrc humain ct 
pouvant presenter unc troncaturc, unc substitution, unc deletion ct/ou unc addition d'au 
moins un acidc amine compare au polypeptide scion P invention. 
20 Par « polypeptide modific », on entend designer un polypeptide obtcnu par 

recombinaison genetique ou par synthese chimique comme cela sera decrit ci-apres, 
presentant une modification par rapport a la sequence normaic. Ces modifications 
pourront notamment porter sur les domaines pre-, pro- ou mature du polypeptide selon 
Pinvention, sur les acides amines a Torigine d'une specificite de spectre ou d'efficacite 
25 de Pactivite, ou a Porigine de la conformation structurale, de la charge, ou de 
Phydrophobicite, et de la capacite de multimerisation et d'insertion membranaire du 
polypeptide selon Pinvention. On pourra ainsi creer des polypeptides d'activite 
equivalente, augmentee ou diminuee, et de specificite equivalente, plus etroite, ou plus 
large. Les modifications pourront aussi porter sur les sequences impliquees dans la 
30 maturation, le transport et Padressage du polypeptide. 

Par « fragment biologiquement actif » d'un polypeptide selon Pinvention, on 
entend designer un fragment polypeptidiquc ayant conserve au moins une activite du 
polypeptide dont il est issu, en particulier : 

• capable d'etre reconnu par un anticorps specifique d'un polypeptide selon 
35 Pinvention ; et/ou 
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• capable cTagir commc antibiotiquc ; et/ou 

• capable d'agir commc agent cytotoxiquc ; ci/ou 

• capable d'agir commc agent antitumoral ; ct/ou 

• capable dc modulcr la reparation dc tissu, la regulation endocrine ou le processus 
5 crinflammation, notanimcnt durant une infection 

Selon ('invention, les fragments biologiquement actifs de polypeptides scion 
rinvention auront au minimum 10 acides amines, de preference 15 acides amines. 

Comme cela a etc indiquc prcccdemment, parmi les fragments 
biologiquement actifs, un fragment prefere est le peptide mature de sequence d'acides 
10 amines SEQ ID N° 6. 

Parmi les homologues du peptide mature, il faut citer les polypeptides dans 
lesquels jusqu'a 5 acides amines ont cte modifies, tronques a Textremite N- ou C- 
terminale, ou bien deletes, ou bien ajoutes, cc qui represente environ SO % de ia 
sequence. 

15 Les fragments biologiquement actifs de ce peptide mature component dc 

preference de 10 a 15 acides amines, dont I'intcrct pourra ctre de pouvoir etrc obtcnus 
facilcment par synthese chimiquc. 

Commc cela est indiquc, les modifications du polypeptide mature auront 
pour objectif notanimcnt dc : 

20 - modulcr Tactivite dc la defensinc, 

- modifier sa specificite, tant au niveau des microorganismes sur lesquels elle est active 
que sur sa localisation tissulairc, 

- modifier sa biodisponibilite. 

Les composes precedents peuvent etre obtenus en utiltsant la chimie 
25 combinatoire, dans laquelle il est possible de faire varier systematiquement des parties 
de polypeptide avant de les tester sur des modeles, cultures cellulaires ou des 
microorganismes par exemple, pour selectionner les composes les plus actifs ou 
presentant les proprietes rechcrchees. 

La synthese chimique presente egatemcnt Tavantage dc pouvoir utiliser : 
30 - des acides amines non naturels, ou 

- des liaisons non peptidiques. 

Ainsi, afin d'amcliorcr la durec de vie des peptides, il pourra etrc interessant 
d'utiliser des acides amines non naturels, par exemple sous forme D, ou bien des 
analogues d'acides amines, notamment des formes soufrees par exemple. 
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Enfin, la structure de la defensinc mature ou de scs homologucs, variants ou 
modifies, de meme que les fragments corrcspondanl, pourronl etrc integres dans des 
structures chimiqucs de type poiypeptidique ou autrcs. Ainsi, il pourra etrc intcrcssam de 
prcvoir mix cxircmites N- ct C-tcrminalcs des composes non reconnus par les proteases. 
5 U invention comprend cgalcment les acides nucleiques codant pour un 

polypeptide scion rinvention. 

Selon un mode prcfere, les acides nucleiques scion V invention scront choisis 
parmi les acides nucleiques suivants : 

a) acidc nucleique de sequence SEQ ID N° 1 (genomiquc) ; 
10 b) acide nucleique de sequence SEQ ID N° 2 (cDNA) ; 

c) acide nucleique equivalent, homologue, mute ou modillc, par rapport aux acides 
nucleiques selon a) ou b) ; 

d) fragment des sequences a), b) ou c) ayant au moins dix bases ; 

e) acide nucleique capable de s'hybridcr avee Tune des sequences telles que definies 
15 en a), b), c) ou d). 

II est entendu que la presentc invention nc conccrne pas les sequences 
genomiques dans leur environncmcnt chromosomiquc naturcl ; il s'agit de sequences qui 
ont etc isolccs, e'est-a-dire qu'cllcs ont etc prclevccs dircctcmcnt ou indircctcmcnt, leur 
environncmcnt ayant etc au moins particllcmcnt modiftc. 
20 II peut ainsi s'agir d'ADN genomiquc, d'ADNc, ou d'ARN, comportant ou 

non des nucleotides non naturels ; il peut s'agir d'acides nucleiques naturels isoles, ou 
d'acides nucleiques de synthese. 

Par acide nucleique equivalent, on entendra un acide nucleique codant pour 
les polypeptides selon T invention, compte tenu de la degenerescence du code genetique, 
25 et les ADNc et ARN correspondants. 

Par acide nucleique homologue, on entendra un acide nucleique dont la 
sequence presente une homologie d'au moins 80 %, de. preference 90 %, avec les 
sequences nucleiques selon rinvention. 

Par acide nucleique mute, on entendra tout acide nucleique codant pour un 
30 polypeptide variant selon rinvention, et tout acide nucleique comportant, par rapport 
aux sequences SEQ ID N° 1 et SEQ ID N° 2, au moins une mutation dans les sequences 
promotrices et/ou regulatrices, lesquelles pourront avoir un effet sur Texpression du 
polypeptide notamment sur son laux d'expression et la tissu-specificite de celle-ci. Les 
sequences presentant un polymorphisme present chez Tetre humain sont done incluses 
35 dans rinvention. Parmi ces polymorphismes, certains pourront conduire a des 
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deficicnccs immunitaircs, de reponse aux infections, a des predispositions et/ou au 
dcvcloppcmcnt dc cancers. 

Par acidc nuclciquc modific, oh entendra tout acidc nuclciquc codant pour 
un polypeptide modi Pic scion ['invention, ou.tout acidc nuclciquc oblcnu par mutagenese 
5 scion des techniques bicn connucs dc I'hommc de Tart, et comportant des modifications 
par rapport aux sequences normales, notammcnt des -mutations dans les sequences 
r^gu lattices ct/ou promotriccs, notammcnt conduisant a une modification du taux ct/ou 
dc la tissu-spccificitc dc I 1 expression du polypeptide. 

La prescnte invention concerne Tensemble des amorces ct sondes, qui 
10 pourront etre marquees selon des methodes bicn connucs de Phomme du metier, 
permcttant dc mcttre en evidence, notammcnt par des techniques basees sur 
Phybridation 6u sur ^'amplification, par exemple par PCR, les sequences nucleiques 
selon r invention, y compris de discriminer les sequences normales des sequences 
mutees. 

15 Parmi les fragments d'acides nucleiques interessants, il faut citer en 

particulicr les oligonucleotides anti-sens, e'est-a-dire dont la structure assure, par 
hybridation avee la sequence cible, unc inhibition de Pexprcssion du produit 
correspondant. 11 faut encore citcr les oligonucleotides sens qui, par interaction avee des 
protcincs impliquccs dans la regulation de Pcxprcssion du produit correspondant, 
20 induiront soil unc inhibition, soit unc activation dc ccttc expression. 

II pourra s'agir de sequences qui agisscnt aussi bicn au niveau des sequences 
exoniqucs ou introniques decrites que sur les sequences flanquantcs, notamment les 
promoteurs et/ou regions 5' UTR. 

La presente invention concerne egalement des vecteurs de cionage ou 
25 d'expression comportant une sequence nucleotidique telle que decrite precedemment. 

Ces vecteurs de cionage ou d'expression pourront comporter des elements 
assurant V expression de la sequence dans une cellule hote, notamment des sequences 
promotrices et des sequences de regulation efTicaces dans ladite cellule. 

Le vecteur en cause pouvant etre a replication autonome ou bien destine a 
30 assurer V integration de la sequence au sein des chromosomes de la cellule hote. 

Dans le cas de systemcs a replication autonome, en fonction dc la celluie 
hote, procaryote ou eucaryote, on utilisera dc preference des systcmes de type 
plasmidique ou des systemes viraux, les virus vecteurs pouvant etre notamment des 
adenovirus (Perricaudet et al., 1992), des retrovirus, des poxvirus ou des virus 
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herpetiques (Epstein et ai., 1992). L'homme de metier connait les technologies 
utilisables pour chacun de ces virus. 

•Ainsi, il est connu d'utiliscr comme. vecteur viral dcs virus ddfectifs dont la 
culture est cfiectude dans dcs cellules dc complementation, ccci cvitanl les risques 
5 cventucls dc proliferation d'un vectcur viral infecticux. 

Lorsque Ton souhaitera V integration de la sequence dans les chromosomes 
de la cellule hote, il sera necessairc dc prevoir de part et d 'autre de la sequence 
nucleotidique a int^grer une ou plusieurs sequences provenant de la cellule hote afin 
d'assurer la recorhbinaison. II s'agit la egalement de procedes qui sont largement decrits 
10 dans la technique anterieure. On pourra, par exemple, utiliser des systemes de type 
plasmidique ou viral ; de tels virus seront, par exemple, les retrovirus (Temin, 1986) ou 
les AAV, Adenovirus Associated Virus (Carter, 1993). 

L'invention concerne egalement les cellules procaryotes ou eucaryotes 
transformees par un vecteur tel que decrit precedemment et ceci afin d'assurer 
15 l'expression d'une d6fensine Def-X naturelle, normale ou variante, ou modifiee, ou bien, 
par exemple, d'un de ses fragments. 

Comme cela a ete indique precedemment, la presente invention concerne 
egalement les polypeptides obtenus par culture des cellules ainsi transformees et 
recuperation de la proteine exprimec, ladile recuperation pouvant ctre efTectuee dc fa^on 
20 intracellulaire ou bien de fa<?on extracellulaire dans le milieu de culture lorsque le 
vecteur a ete con<?u pour assurer la secretion de la proteine par le biais, par exemple, 
d'une sequence "signal", le polypeptide etant sous forme d'un pre-polypcptide ou 
pr^pro-polypeptide. Les constructions permettant la s£cr6tion des polypeptides sont 
connues, aussi bien pour des systemes procaryotes que des systemes eucaryotes. Dans le 
25 cadre de la presente invention, certains des polypeptides Def-X pourront comporter leur 
propre systeme de s6cr6tion ou d' insertion membranaire. 

II est bien entendu que les polypeptides recombinants selon 1' invention 
peuvent etre obtenus sous forme glycosylee ou non glycosylee et presenter ou non la 
structure tertiaire naturelle. 
30 Parmi les cellules utilisables pour la production de ces polypeptides, il faut 

citer bien entendu les cellules bacteriennes (Olins et Lee, 1993), mais dgalement les 
cellules de levure (Buckholz, 1993), de meme que les cellules animales, en particulier les 
cultures de cellules de mammifere (Edwards et Aruffo, 1993) mais egalement les 
cellules d'insectes dans lesquelles on peut utiliser des proeddes mettant en oeuvre des 
35 baculo virus par exemple (Luckow, 1993). 
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Les cellules ainsi obtenues pcuvenl permettre de preparer des polypeptides 
naturels, variants ou modifies, Def-X, mais cgalcmcnt des fragments de ces 
polypeptides, notammcnt des polypeptides pouvant corrcspondrc aux fragments 
biologiqucmcnt actifs. 

5 La presente invention conccrnc, cn outre, les memcs polypeptides selon 

T invention mais obtenus par synthese chimiquc ct pouvant comportcr des acides amines 
non naturels ou modifies. 

Les polypeptides selon la presente invention, en particulier la defensine 
mature, de meme que les homologucs, derives ou polypeptides matures modifies, 
10 peuvent etre obtenus par synthese chimique et ce en utilisant Tune quelconquc des 
nombreuses syntheses peptidiques connues, par exemple les techniques mcttant cn 
oeuvre des phases solides ou des techniques utilisant des phases solides partielles, par 
condensation de fragments ou par une synthese en solution classique. 

Lorsque les composes selon la presente invention sont synthetises par la 
15 methode en phase solide, Tacide amine C-terminal est fixe sur un support solide incrte ct 
comporte des groupes protecteurs de son groupement amino en alpha (et si ccla est 
necessaire, des protections sur ses groupes fonctionnels lateraux). 

A la fin de cette etape, lc groupc protcctcur du groupement amino terminal 
est elimine et on fixe le second acidc amine comportant lui aussi les protections 
20 ndcessaires. 

Les groupes protecteurs N-tcrminaux sont 61imines apres que chaque acidc 
amine a ete fixe, par contre on mainticnt, bien entendu, la protection sur les chaines 
laterales. 

Lorsque la chaine polypeptidique est complete, on clive le peptide de son 
25 support et on ^limine les groupes de protection lateraux. 

La technique de synthase en phase solide est d6crite notamment dans Stewart 
et al. (1984) et Bodanszky (1984). 

II ne sera pas ici evoque les details de la synthese, il convient simplement de 
rappeler que les groupes protecteurs preferes pour les groupements alpha-amino sont des 
30 groupes protecteurs de type urethane (BOC ou FMOC). Quant aux reactifs de couplage, 
ils sont tres nombreux, parmi eux il faut bien entendu citer plus particulierement la N,N'- 
diisopropyl-carbodiimine (DIC) mise en ceuvre en general dans le DMF ou le DCM. 

Lorsque Ton souhaitera utiliser des amino-acides non naturels, il pourra etre 
necessaire de prevoir d'autres types de reactif et en particulier d'autres types de systeme 
35 de protection. 
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La presentc invention concerne egalement les anticorps polyclonaux ou 
monoclonaux obtenus par reaction immunologiquc d'un organismc humain ou animal 
avec un agent immunogene constituc par un polypeptide scion l'invention, notammcnt 
un polypeptide obtenu par culture d'une des cellules prdccdcmmcnt decrites, ou par 
5 synthese chimiquc comme indiquc prccedcmmcnt. 

L' invention s'ctend done aux anticorps monoclonaux ct polyclonaux ou un 
dc leurs fragments, anticorps chimcriqucs, capables dc rcconnaitrc specifiquement un 
polypeptide selon Pinvcntion. 

L' invention comprend aussi les anticorps selon V invention, caract crises en cc 
10 qu'ils sont marques. 

Les anticorps marques pourront etre, par exemple, immunoconjugucs a des 
enzymes telles que la peroxydase ou la phosphatase alcaline, ou marques a 1'aide dc 
composes fluorescents, de la biotine ou encore radiomarqucs. Les techniques de 
marquage sont bien connues de Thomme du metier et ne seront pas developpees dans la 
1 5 presente description. 

L'invention s'etend egalement a Tutilisation d'un polypeptide selon 
I'invention comme agent antimicrobien, notamment antibacterien, antifongique, antiviral 
et/ou antiparasitaire, comme agent cytotoxique. a visec notammcnt anticancereuse, et/ou 
comme agent de modulation des processus d'inflammation, de reparation tissulairc et de 
20 regulation endocrine, notammcnt corticostatique. 

Selon un autre aspect, l'invention concerne une composition pharmaceutique 
comprenant un polypeptide selon l'invention, pouvant etre associee a un vehicule 
pharmaceutiquement acceptable. 

Une telle composition pourra etre administr^e par voie systemique, locale ou 

25 topique. 

Son mode d'administration, sa posologie, ses formes galeniques optimales 
pourront etre determines selon les criteres gendralement pris en compte dans 
T&ablissement d'un traitement adapte a un patient, notamment son age, son poids 
corporel, la tolerance de traitement, ses efTets secondares constates, etc.. 

30 L'invention comprend egalement une. composition pharmaceutique 

comprenant un vecteur selon l'invention capable d'exprimer in vivo un polypeptide selon 
l'invention, pouvant etre associe a un vehicule pharmaceutiquement acceptable. 

II est egalement possible de prevoir 1' expression de polypeptides ou leurs 
fragments in vivo, notamment par le biais de la therapie genique et en utilisant les 

35 vecteurs qui ont ete decrits precedemment. 
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Dans le cadre de la therapic genique, il est possible egalement de prevoir 
Putilisation des sequences des genes ou des ADNc pnScddcmment decrits, "nus", cette 
technique a notamment dt6 developpee par la societd Vical, qui a montre qu'il ctait, dans 
ces conditions, possible d'exprimcr ic polypeptide dans certains tissus sans avoir rccours 
5 au support d'un vectcur viral notamment. 

Toujours dans 1c cadre de la therapic genique, ii est egalement possible de 
prevoir Tutilisation de cellules transformecs cx-vivo, lesquelles pourront etre ensuite 
reimplantees, soit telles quelles, soit au seinde systemcs de type organotde, tel que cela 
est egalement connu dans l'6tat de la technique (Danos et al. 1993). On peut egalement 
10 envisager Putilisation d'agents facilitant le ciblage d'un type cellulaire determine, la 
penetration dans les cellules ou le transport vers I e noyau. 

Lesdites compositions pharmaceutiques sont, selon Tinvention, destinees a la 
prevention et/ou au traitement des infections microbiennes, notamment les infections 
microbiennes d'origines bacteriennes, de bacteries Gram-positives ou Gram-negatives, 
15 mycobacteriennes, fongiques et virales, ou parasitaires, notamment de spirochetes. 

Selon un mode prefere, Tinvention concerne avantageusement les 
compositions pharmaceutiques selon Tinvention caract^risees en ce que les infections 
virales sont des infections liees a des virus a enveloppe, notamment les virus HSV et 
HIV. 

20 L' invention a Egalement pour objet des compositions pharmaceutiques selon 

V invention, destinees a la prevention et/ou au traitement des cancers, notamment les 
melanomes, le cancer du foie, de la prostate, du poumon non a petites cellules ou le 
carcinome colorectal. 

L* invention comprend, en outre, des compositions pharmaceutiques selon 

25 1'invention, destinies a augmenter les defenses immunitaires, a augmenter les defenses 
immunitaires en cas d'immunodeficience acquise ou a privenir rimmunodeficience, 
notamment pour le traitement du psoriasis, ou a moduler les processus inflammatoires 
dans les cas notamment de maladies a inflammation chronique. 

Les polypeptides selon la presente invention sont plus particulierement 

30 utilisables sous forme topique externe, par exemple sur la peau et les muqueuses. Ces 
formes topiques externes peuvent etre aussi bien a usage pharmaceutique, 
dermatologique qu'a usage cosmitique. 

En particulier, ces compositions peuvent etre utilisees comme agent 
antiseptique pharmaceutique ou bien comme antiseptique dans certains cosmetiques, soit 
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pour assurer un nettoyage de la peau ou des phaneres et/ou a titre de conservatcur des 
compositions. 

Les compositions topiqucs scion la prcscntc invention pcuvent etre utilisccs 
notamment dans certaincs affections cutanecs, oculaircs, vaginalcs ou buccalcs. EIlcs 
5 peuvent egalcment etre utilisccs commc agent cosmctiquc additionncl, notamment dans 
certains shampooings traitants.- 

L'invention concernc egalcment la misc en evidence de Fabsence ou d'une 
quantite anormale de proteine. ou d'acidc nucleique corrcspondant a la defensine X 
comme marqueur d'une infection ou.de pathologies qui seront decrites ci-apres. 
10 L'invention concerne egalement la mise en evidence d'une forme anormale 

de la proteine ou la presence d'un acide nucleique anormal correspondant a une 
defensine mutee qui peut eventuellement etre totalement inactive. Dans ce cas, la 
presence de cette forme anormale peut etre un marqueur de predisposition a cenaines 
affections, notamment Fimmunodeficience et/ou des cancers. 
15 C'est pourquoi, la presente invention concerne une methode de diagnostic 

d'une immunodeficience et/ou d'une predisposition a certains types de cancers, 
caracterisee en ce qu'on met en evidence dans un prelevement de patient la presence 
d'une defensine anormale et/ou d'une sequence codant pour une defensine anormale. 

Les methodes de diagnostic scion la presente invention pcrmettcnt, 
20 notamment, la mise en evidence d'une immunodeficience, et/ou d'une predisposition a 
un ou des cancers, notamment ceux cites precedemment, en particulier dans des families 
£ risque. Ce type de diagnostic sera en general effectue par mise en evidence des formes 
mutees de la proteine ou des sequences d'acide nucleique. 

Mais F invention concerne egalement des methodes de diagnostic de 
25 F inflammation, d'immunodeficience, de predisposition a des affections de type cancer 
et/ou d' infections dues k des microorganismes ou H6es k un deficit immunitaire ou 
phenomene inflammatoire, caract6risees en ce qu'elles comprennent le dosage d'un 
polypeptide ou d'un acide nucleique selon 1' invention dans un 6chantillon biologique et 
la comparaison du resultat dudit dosage obtenu avec la quantity de polypeptide ou 
30 d'acide nucleique presente normalement dans un echantillon biologique Equivalent. 

Dans ce cas, le dosage peptidique permettra, en general, une detection d'unc 
infection microbienne ou parasitaire et/ou d'une inflammation. Les dosages peptidiques 
peuvent etre realises par tout procede connu, ELISA ou RIA par exemple. La mise en 
evidence d'une forme anormale de la defensine-X peut etre realisee, par exemple, a 
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l'aide d'un anticorps monoclonal spccifique de cette forme, en particulier les aniicorps 
objet de ['invention. 

Selon un mode dc realisation preferc, Tinvcntion comprend avantagcuscmcnt 
les methodes caractdrisdes cn cc qu'clles mcttcnt en oeuvrc unc sonde ct/ou unc amorce 
5 oligonucleotidiquc selon Pinvcntion. 

On prdfdrera en general les methodes dans lcsquellcs tout ou partie de la 
sequence correspondant au polypeptide Dcf-X est amplifidc prealablcment par dosage 
d'acide nucleique selon I' invention, ces methodes d'amplification pouvant etre realisees 
par des methodes dites PCR ou PCR-Iike. Par PCR-like on entendra designer toutes les 
10 methodes mettant en oeuvre des reproductions directes ou indirectes des sequences 
d'acides nucl&ques, ou bicn dans lesquelles les systemes de marquage ont ete amplifies, 
ces techniques sont bien entendu connues, en general il s'agit de ramplification de 
TADN par une polymerase ; lorsque Techantillon d'origine est un ARN il convient 
prealablement d'effectuer une transcription reverse. II existe actuellement de tres 
15 nombreux precedes permettant cette amplification, par exemple les methodes dites 
NASBA "Nucleic Acid Sequence Based Amplification" (Compton 1991), TAS 
"Transcription based Amplification System" (Guatelli et al. 1990), LCR "Ligasc Chain 
Reaction" (Landegren et al. 1988), "Endo Run Amplification" (ERA), "Cycling Probe 
Reaction" (CPR), et SDA "Strand Displacement Amplification" (Walker et al. 1992), 
20 bien connues de Thomme du metier. 

L' invention concerne cn outre des kits ou necessaires de diagnostic pour la 
determination d'une infection microbienne ou parasitaire, d'une inflammation, d'une 
immunodeficience et/ou d'une predisposition a des affections de type cancer, 
caractdrises en ce qu'ils comprennent un anticorps selon Tinvention. 
25 Les kits ou ndcessaires de diagnostic pour la determination d'une infection 

microbienne ou parasitaire, d'une inflammation, d'une immunodeficience et/ou de 
predisposition i des affections de type cancer, caracterises en ce qu'ils comprennent une 
sonde et/ou une amorce selon V invention font egalement partie de V invention. 

L'invention a, enfin, pour objet i'utilisation de polypeptide selon l'invention 
30 comme pesticide, notamment pour la culture de vegetaux d'interet industriel comme, par 
exemple, les plantes vivrieres telles que le mais, le ble, le soja, le riz ou le colza, les 
plantes fourrageres, les arbres fruitiers, la vigne ou les plantes ornementales. 

D'autres caracteristiques et avantages de la presente invention apparaitront a 
la lecture des exemples ci-apres, illustres par les figures dont les legendes sont decrites 
35 ci-dessous. 
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Leeenrics des figures 
Fieurc 1 

Sequence genomique de hDef-X. 

Est presentee la lotalite de la sequence d'ADN genomique de hDef-X qui prcsenic une 
5 homologie significative avee le gene codant pour hDcf-4 (1 1NP-4). 

La sequence prcscntc les sites suivanis, dont la presence est deduite par homologie avec 
la sequence hDef-4 : 





• CAAT box 


1711-1714 




• TATA box 


1758-1767 


10 


• mR.NA start 


1836 




• exon 1 


1836-1874 




• site d'epissage 1 


GTCAGT 




• insertion Alu 


2155-2335 




• insertion fragment de LI 


2710-2780 


15 


• site d'epissage 2 


CAG 




• exon 2 


3394-3577 




• debut dc phase codante 


3406 




• site d'epissage 3 


GTGAGA 




• site d'epissage 4 


CAG 


20 


• exon 3 


4164-4379 




• fin dc phase codante 


4276 




• site de polyadenylation 


4374-4379. 



Figure 2 

Alignement des sequences genomiques des defensines humaines Def-X ct Def-4 (HNP- 
25 4). 

Alignement de la lotalite de la sequence d'ADN genomique de la nouvelle defensine 
Def-X presentant une homologie avec T ADN genomique de hDef-4 (GenBank accession 
number Ul 8745). 

Les annotations presentent les positions sur la sequence de hDef-4 des signaux CAAT 
30 box, TATA box, sites d'epissage, debuts et fins d'introns/d'exons, debut de 
transcription, site de polyadenylation. 
Figure 3 

Alignement des sequences d 1 ADNc de hDef-4 (HNP-4) et hDef-X. 
Les sequences presentent une homologie globale dc 61,4 %. L' alignement revele une 
35 insertion d'environ 75 bases en aval du codon STOP, presentes sur la sequence de hDef- 
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4, mais non sur celle de hDef-X ; I'homoiogie forte reprend sur toule la region comprise 
entre Pextr^mite de cette insertion et celle dc 1'ADNc. En dehors dc cettc region 
d'insertion, le degr6 d'homologie entrc sequences nuclciqucs est done rcmarquable. 
Figure 4 

5 Sequence peptidique dc la protcinc hDcf-X. 

La position des sites de clivage du signal peptide ct dc la region pro ont etc deduites de 
Paiignemcnt des sequences peptidiqucs dc hDef-4 et hDcf-X. 
Figure 5 

Alignement des sequences peptidiques des defensines humaines connues hDef-1, hDef- 
10 4, hDef-5, et hDef-6 avec hDef-X. 

* L'etoile indique un acide amine conserve sur les cinq sequences. 

• Le point indique un acide amine dont la classe est conservee sur les cinq sequences 
(acide amine soit identique, soit faisant Tobjet d'une substitution conservative). 

A six fleches indiquent les positions des six cysteines conservees au travers de la 
15 classe des defensines classiques et responsables de la structure tridimensionnelle 

necessaire a Tactivite de ces peptides. 

EXEMPLES 

20 Exemplc 1 : Identification du gene cod;uit pour hDcf-X 
Isolement du BAC B072SB12 

Afin d'analyser la region 8p23 du genome humain, notamment dans la 
region connue comme portant des genes codant pour des defensines humaines, on a isole 
un BAC ("Bacterial Artificial Chromosome") correspondant a ladite region. Une banque 

25 de BACs couvrant le genome humain complet a ete pr6par6e a partir de TADN d f une 
lignee lymphoblastique humaine ddriv^e de l'individu n° 8445 des families du CEPH. 
Cette lignee a 6t6 utilisee comme source d'ADN de haut poids moteculaire. L' ADN a ete 
partiellement d\g€r6 par T enzyme de restriction BamHl, puis clon£ au site BamHl du 
plasmide pBeloBacIL Les clones ainsi obtenus ont &6 "pool^s" et cribles selon une 

30 procedure d'analyse tridimensionnelle preeddemment decrite pour le criblage des 
banques de YACs ("Yeast Artificial Chromosome") (Chumakov et al., 1992 et 1995). 
Les pools tridimensionnels obtenus ont ete cribl6s par PCR a Taide des amorces 
encadrant le marqueur SHGC- 10793, pour Neutrophil defensin 4 precursor (GeneBank : 
numero d'accession U18745) ; un clone du BAC B0725 B 12 a ete ainsi isole. 
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Apres digestion par I'enzyme de restriction NotI, la taille de I'inscrt porte par 
ce BAC a 6te d&ermin<£e sur un gel d'agarose 0,8 % aprds migration par elcctrophorese 
en champ alternd (CHEF) (4 hcurcs a 9 Volts/cm, avcc un angle de 100°, a 11°C en 
tampon 0,5 x TAE). On a ainsi mis en evidence que Ic BAC B0725BI2 portc un insert 
5 de 220 kb, avcc un site interne pour r enzyme Not I. 

Localisation chromosomiquc du BAC B072SB12 par hybridation in situ fiuorcsccnte 
(FISH) 

La localisation chromosomiquc du BAC dans la region candidate 8p23.1- 
23.2 a ete confirmee par hybridation in situ fluorescente (FISH) sur chromosomes 

10 metaphasiques, selon la methode decrite par Cherif et al., (1990). 
Sequencage de Pinsert du BAC B0725B12 

Afin de sequencer Pinsert du BAC B0725B12, on a prepare une banque de 
sous-clones a partir de P ADN sonique de ce BAC. 

Les cellules issues d'un litre de culture "overnight" .ont ete traitees par lyse 

15 alcaline selon les techniques classiques. Apres centrifugation du produit obtenu dans un 
gradient de chlorure de cesium, 12 jig d'ADN du BAC B0725B12 ont ete purifies. 3 pg 
d'ADN ont et6 soniques afin d'obtenir des fragments dont les tallies se distribuent 
uniformement de 1,2 kb a 1,5 kb. Les fragments obtenus ont ete traites dans un volume 
de 50 \i\ avec 2 unites de Vent polymerase pendant 20 minutes a 70°C, en presence des 4 

20 ddoxytriphosphates (100 ^iM). Les fragments aux extremites franches rdsultant dc cette 
6tape ont 6te separes par electrophoresc en gel 1 % d'agarose a bas point de fusion (60 
Volts pendant 3 heures). Les fragments groupes selon leurs tailles ont €it excises et les 
bandes obtenues traitdes par Pagarose. Apres extraction au chloroforme et dialyse sur 
colonnes Microcon 100, 1'ADN en solution a 6te ajuste k une concentration de 100 ng/jil. 

25 Une ligation a 6t6 effectute "overnight" en mettant en presence 100 ng de l'ADN 
fragment^ du BAC B0725B12 et 20 ng d'ADN du vecteur BluescriptSK linearise par 
digestion enzymatique, et traite par la phosphatase alcaline. Cette reaction a ete realisee 
dans un volume final de 10 ^1 en presence de 40 unit6s/^l de T4 ADN ligase (New 
England Biolabs). Les produits de ligation ont ensuite servi a transformer par 

30 61ectroporation, soit une souche XL-Blue (pour les plasmides multicopies), soit une 
souche D10HB (pour les sous-clones issus du BAC). Les clones lacZ" resistant a 
Pantibiotique ont 6t6 repiques individuellement en microplaques pour stockage et 
siquenpage. 

On a ainsi obtenu 960 sous-clones correspondant a P insertion de fragments 
35 de 1,2 kb a 1,5 kb au site BamHI (rendu franc) du plasmide BluescriptSK. 
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Les inserts de ces sous-clones ont ete amplifies par PCR sur cultures 
bacterienncs conduites "overnight", cn utilisant les amorces des vecteurs flanquant les 
insertions. La sequence des cxtrcmitcs dc ccs inserts (cn moyenne 500 bases de chaquc 
cotd) a et6 dctcrmincc par sequence automatiquc fluorescent sur scqucnccur AB1 377, 
5 equipc du logicicl ABl Prism DN A Sequencing Analysis (version 2. 1 .2). 

Les fragments de sequence provenant des sous-BACs ont etc assembles par 
le logiciel Gap4 de R. Staden (Bonficld et al., 1995). Ce logiciel permet la reconstruction 
d f une sequence complete a partir de fragments de sequences. La sequence deduite de 
Talignement des dtfferents fragments est la sequence consensus. 
10 On a enfin utilise des techniques de sequenpage dirige (marche systematique 

de I'amorce) pour parfaire les sequences et relier les contigs. 
Analyse des sequences pour Identification de genes 

Les exons potentiels de V insert du BAC B0725B12 ont ete reperes par 
recherche d'homologie sur les banques publiques de proteines, d'acides nucleiques et 
15 d'EST (Expressed S equence Tags) . 

Banques de donnees 

On a utilise des rcfontcs locales des principales banques publiques. La 
banque de proteines utilisees est constitute par la fusion non redondante des banques 
20 Genpept (traduction automatique de GenBank, NCBI ; Benson et al., 1996) ; Swissprot 
(George et al., 1996) et P1R/NBRF (Bairoch et al., 1996). Les doublons ont ete elimines 
par le logiciel "nrdb" (domaine public, NCBI ; Benson et al, 1996). Les repetitions 
internes ont ensuite 6te masquees par le logiciel "xnu" (domaine public, NCBI ; Benson 
et al., 1996). La banque r&ultante, denommee NRPU (Non-Redundant Protein-Unique) 
25 a servi de reference pour les recherches d f homologies prot&ques. Les homologies 
trouvees avec cette banque ont permis de localiser des regions codant potentiellement 
pour un fragment de prot&ne au moins apparent^ k une proline connue (exons codants). 
La banque dTBST utiliste est composee des sous-sections "gbest" (1-9) de Genbank 
(NCBI ; Benson et al., 1996). Elle contient tous les fragments de transcrits publics. 
30 Les homologies trouvees avec cette banque ont permis de localiser des 

regions potentiellement transcrites (presentes sur TARN messager). 

La banque d'acides nucleiques (autres que les EST) utilisde contient toutes 
autres sous-sections de Genbank et de l'EMBL (Rodriguez-Tome et al., 1996) dont les 
doublons ont ete elimines comme precedemment. 
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Logicic/s 

On a utilise Penscmbie de logicicls BLAST (Altschu! et al . 1990) dc 
rechcrclic d'homologies cnirc unc sequence ct des banqucs dc dpnnccs protciques ou 
nuclciqucs. Lcs scuils dc signification utilises dependent de la longueur el de la 
5 complcxitc de la region testcc ainsi que de la taillc de la banquc de reference. Us out etc 
ajustes ct adaptcs a chaquc analyse. 

Excmnlc 2 : analyse des sequences nuclcintics ct pcotidiques dc hDcf-X 
Structure du gene codant pour hDef-X 

10 L'alignement du gene codant pour hDcf-X avee ceux codant pour les 

defensines connues a permis dc noter une liomologie maximale cntre hDcf-X et hDcf-4 
(Figure 2). Le laux global d'homoiogie des deux sequences nuclciques est de 72 %. Les 
deux seules regions de V ADN genomique de hDef-X nc presentant pas d'homologic 
avec celui de hDef-4 correspondent a deux zones d'inscrtion de sequence repetce dans la 

15 sequence dc hDef-X, qui sont absentes sur la sequence de hDcf-4 : un clement de type 
Alu (positions 2155 a 2335) ct un fragment d'elcmcnt dc Line 1 (positions 2710 a 2780). 

On note une conservation important c de la region flanquant cn 5' la region 
promotricc, d'ou dccoulc probablcment unc conservation importantc des elements dc 
regulation dc la stabilite du mcssagcr ct dc Tcxprcssion du gene. 

20 La forte conservation dc la sequence dc Pcxon 1, non traduit, pcrmct de 

rattachcr definitivement la defensinc hDcf-X a la classc des defensines classiqucs 
hematopoietiques, soit hDef-1, 2, 3 et 4, par opposition aux defensines enteriques hDcf-5 
et 6, dont la sequence genomique ne comporte que deux exons, tous deux codants. 

L'alignement des ADNc de hDef-4 et hDcf-X, indiquant unc homologie 

25 superieure a 60 %, est presente Figure 3. 
Analyse proteique 

La sequence peptidique de la defensine selon T invention est representee 
Figure 4. Les trois domaines de la proteine sont positionnes comme suit : 

• peptide signal : aa 1-19 
30 • region pro : aa 20-63 

• peptide mature : aa 64-94. 

Les degres d'homologies specifiques entre hDef-4 et hDef-X ont etc 
calcules, selon la region de la proteine concernee : 

• peptide signal : 63,2% 
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• region pro : 52,3 % 

• peptide mature : 37,9 %. 
L'homologie globale est dc 49,5 %. Ccs chiflres confirmcnt la trcs forte 

homologic qui cxistc entrc defensines, homologic maximalc au niveau des peptides 
signaux et minimalc au niveau des peptides matures. 

On rctrouvc dans la sequence protciquc primairc dc Dcf-X les acides amines 
conserves dans la classc des defensines classiqucs, notamment les six cysteines 
impliquees dans la structure tridimensionncllc de celles-ci (Figure 5). 

Afin de predirc les structures secondaires presentes sur la defensine selon 
l'invention, on a utilise les logiciels de prediction de structure secondaire inclus dans le 
Protein Interpretation Package, Copyright MRC 1994, Medical Research Council, 
Hillsroad, Cambridge, United Kingdom. 

Ces logiciels ont notamment permis de comparer les structures predites de 
Def-X et HNP-4. Profils d'hydrophobicite, structures en alpha-helices, feuillets p, 
amphiphilicite sont superposables dans les deux peptides, ce qui suggere des processus 
analogues d'insertion membranaire et dc formation de canaux ioniqucs multimcriqucs 
pour ces deux defensines. 

Excmnlc 3 : Recherche dc mutations assocides A des cas familiaux dc cancers 
20 Extraction de TADN g6nomicuie 

L'ADN g^nomique de patients immunodeficients ou atteints de cancer, est 
extrait du sang veineux peripherique apres lyse cellulaire, digestion proteique, partition 
organique et finalement precipitation alcoolique, selon des techniques classiques bien 
connues de Fhomme de Tart. 
25 II est notamment interessant d'etudier la presence de mutations dans TADN 

g^nomique d'individus issus de families k fort taux cancer, tous types de cancers 
confondus. Une deficience dans un gene de ddfensine de granulocyte, tel hDef-X peut en 
effet avoir un role dans la predisposition aux cancers, comme mentionne precedemment. 
Amplification de V ADN gdnomioue 
30 Des amorces oligonuclcotidiques sont utilisees pour Tamplification 

ginomique des sequences exoniques dcrivees du BAC B0725B12 ; elles sont predites 
par analyse informatique, et definies a Taide du logiciel OSP (Hillier et al., 1991). 

Toutes ces amorces contiennent, en amont des bases specifiquement ciblees 
par ramplification, une queue oligonucleotidique universelle commune, destinee a 
35 permettre le sequen?age des fragments amplifies (PU 5*- 
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TGTAAAACG ACGGCC AGT-3 * pour les amorces en amont, ct RP : 5'- 
CAGG AAAC AGCTATG ACC-3 * pour Ics amorces en aval). 

Les amorces oligonuclcotidiqucs sont synthetisccs scion la methode des 
phosphoramiditcs, sur un synthctiscur GENSET UFPS 24. 1. 
5 L'amplification dc chaquc sequence exonique prcditc est realisce par reaction 

d'amplification en chainc par polymerase (PCR), dans les conditions suivantes : 



Volume final 50 jil 

ADN gcnomique 1 00 ng 

MgC12 2 mM 

1 0 dNTP (pour chacun) 200 

Amorce (pour chacune) 7.5 pmoles 

AmpliTaq Gold DN A polymerase (Perkin) 1 unite 

Tampon de PCR (10X = 0.1 M Tris HCi pH 8.3, 0.5 M KC1) 1 X. 



L'amplification est realisec dans un thermocycleur Perkin Elmer 9600 ou MJ 
15 Research PTC200 avec couvercle chauffant. Apres un chauflfage a 94°C pendant 10 
minutes, 35 cycles sont efTectues. Chaquc cycle comprend : 30 sccondes a 94°C, 1 
minute a 55°C et 30 secondes a 72°C. Un segment final d' elongation de 7 minutes a 
72°C termine Tamplification. 

La quantite de produits d'amplification obtenuc est determinec sur 
20 microplaque de 96 puits, par fluorometrie, utilisant Tagent intercalant Picogreen 
(Molecular Probes). 

Detection des polvmorphismes/mutations 

Les produits de l'amplification genomique par PCR sont sequences sur 
sdquenceur automatique ABI 377, en utilisant des amorces fluorescentes marquees par 
25 les fluorochromes ABI (Joe, Fam, Rox et Tamra) et l'ADN polymerase 
Thermosequanase (Amersham). 

Les reactions sont realisees en microplaques de 96 puits, sur thermocycleur 
Perkin Elmer 9600, dans des conditions classiques de cycles de temperature : 

- 8 cycles : denaturation : 5 sec. a 94°C ; hybridation : 10 sec. ; elongation : 30 sec. a 
30 72°C, puis 

- 13 cycles : denaturation ; 5 sec. a 94°C ; elongation : 30 sec. a 72°C. 

6 unites de Thermosequanase, et 5-25 ng de produit d'amplification sont 
utilises par reaction de sequence. 

A Tissue des cycles d'amplification, les produits des reactions de sequence 
35 sont precipites dans Tethanol, resuspendus dans du tampon de charge contenant de la 
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formamide, denatures, et deposes sur gels d'acrylamide 4 % ; les electrophoreses (2 
heures 30 a 3 000 Volts) sont conduitcs sur sequenceurs ABI 377 equipcs dcs logiciels 
ABI dc collection ct d'analysc (ABI Prism DNA Sequencing Analysis Software, version 
2.1.2.). 

5 Les sequences obtenucs chez dcs patients attcints dcs deficiences ctudiees, 

notamment chez dcs patients issus dc families a forte predisposition aux cancers, sont 
companies aux sequences obtenues chez dcs sujets controles, apparentes ct non 
apparentes. Une analyse statistique (calcul de lod score) pcrmet de conclure quant a la 
signification de la presence d'un site d'heterozygotie et a son association avec une 
10 predisposition aux cancers. 

Excmnlc 4 : Recherche dc mutations nonctuelles 

Les mutations ponctuellcs identifies comme indique ci-dessus, peuvent 
ensuite etre mises en evidence chez dcs sujets presentant une potentielle deficiencc dans 
15 le gene codant pour hDef-X, selon de nombreuses methodes connues de Thomme de 
Tart. Parmi celles-ci, on peut citcr la iiste non exhaustive suivante : 

• sequenfage 

• « single nucleotide primer extension » (Syvanen ct al., 1990) 

• RFLP 

20 • recherche de « single strand conformation polymorphism » 

• methodes basees sur un clivagc dcs regions misappariees (clivage enzymatiquc par 
la SI nuclease, clivage chimique par differents composes tels que la piperidine ou le 
tetroxide d' osmium) 

• mise en Evidence d'heteroduplex en electrophorese 

25 • m&hodes basees sur Tutilisation d'« allele specific oligonucleotide » (ASO, 
Stoneking et al, 1991) 

• m6thode OLA (« dual color oligonucleotide ligation assay, Samiotaki et al., 1994) 

• methode ARMS (« amplification refractory mutation system))), ou ASA (« allele 
specific amplification »), ou PAS A (« PCR amplification of specific allele))) (Wu et 

30 al., 1989). 
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REVINDICATIONS 



1) Polypeptide isole choisi parmi les polypeptides suivants : 
a) polypeptide doni la sequence d'acides amines est la sequence SEQ ID N° 3 ; 
5 b) polypeptide homologuc, variant ou modific du polypeptide dont la sequence 
d'acides amines est la sequence SEQ ID N° 3 ; 

c) polypeptide dont la sequence d'acides amines est la sequence d'acides amines d'un 
fragment biologiquemcnt actif d'un polypeptide tel que defini en a) ou b) ; 

d) polypeptide comprenant au moms un fragment tel que defini en c). 

10 2) Polypeptide selon la revendication 1, caracterise en ce qu'il est constitue 

dc Tun au moins des fragments suivants : 

a) peptide signal dont la sequence d'acides amines est la sequence SEQ ID N° A ; 

b) region pro dont la sequence d'acides amines est la sequence SEQ ID N° 5 ; 

c) peptide mature dont la sequence d'acides amines est la sequence SEQ ID N°6 ; ou 
15 d) fragment homologuc, variant ou modifie d'un peptide selon a), b) ou c). 

3) Polypeptide dont la sequence d'acides amines est la sequence SEQ ID 
N° 6, scs homologucs, variants ou formes modificcs ainsi que leurs fragments 
biologiquemcnt actifs ct les polypeptides les contcnant. 

4) Acidc nucleique codant pour un polypeptide selon Tune des 
20 revendications 1 a 3. 

5) Acide nucleique choisi parmi les acides nuclciqucs suivants : 

a) acide nucleique de sequence SEQ ID N° 1 ; 

b) acide nucleique de sequence SEQ ID N° 2 ; 

c) acide nucleique equivalent, homologue, mute ou modifie, par rapport aux acides 
25 nucleiques selon a) ou b) ; 

d) fragment des sequences a), b) ou c) ayant au moins dix bases ; 

e) acide nucleique capable de s'hybrider avec Tune des sequences telles que definies 
en a), b), c) ou d). 

6) Vecteur de clonage ou d'expression dans une cellule hotc appropriee 
30 d'une sequence nucleotidique, caracterise en ce qu'il comporte une sequence selon Tune 

des revendications A et 5. 

7) Vecteur selon la revendication 6, caracterise en ce quMl comporte les 
elements assurant V expression de ladite sequence dans ladite cellule hote. 

8) Ceilule transformer par un vecteur selon Tune des revendications 6 et 7. 
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9) Cellule selon la revendication 8, caracteriscc en ce qu'il s'agit d'une 
cellule procaryote. 

10) Cellule scion la revendication S,. caracteriscc en cc qifil s'agit d'unc 
cellule cucaryotc. 

5 11) Procede dc production d'un polypeptide scion Tunc des revcndicalions 1 

a 3, caracterise en cc qu'on eultive unc cellule scion Tunc des revcndicalions 8 a 10 ct en 
cc que Ton rccuperc le polypeptide produit. 

12) Polypeptide susceptible d'etre obtenu par la misc en acuvre du procede 
selon la revendication 1 1. 
10 13) Polypeptide selon Tune des revendications I a 3, caracterise en cc qu'i! 

est obtenu par synthese chimique. 

14) Anticorps monoclonal ou polyclonal ou un de leurs fragments, anticorps 
chimeriques, caracterise en ce quMl est capable de reconnaitre specifiquement un 
polypeptide selon Tune des revendications 1 a 3, 12 et 13. 
15 15) Anticorps selon la revendication 14, caracterise en cc qu'il est marque. 

16) Sonde ou amorce oligonuclcotidiquc, caracteriscc en ce qu'clle est 
constitute d'un acidc nucleique selon Tunc des revendications 4 ct 5. 

17) Sonde selon la revendication 16, caracteriscc cn cc qu'clle est marquee. 

18) Utilisation d'un polypeptide scion Tunc des revendications 1 a 3, 12 ct 
20 13 comme agent antimicrobien et/ou antiparasitairc. 

19) Utilisation d'un polypeptide scion Tune des revendications 1 a 3, 12 et 
13 comme agent cytotoxique, notamment a visec anticancereuse. 

20) Utilisation d'un polypeptide selon Tune des revendications 1 a 3, 12 et 
13 comme agent de modulation des processus de Tinflammation, de reparation tissulaire 

25 et de regulation endocrine, notamment corticostatique. 

21) Composition pour usage topique externe, caracterisee en ce qu'elle 
comporte au moins un polypeptide selon Tune des revendications 1 a 3, 12 et 13. 

22) Composition selon la revendication 21, caracterisee en ce qu'il s'agit 
d'une composition cosmetique. 

30 23) Composition pharmaceutique comprenant un polypeptide selon Tune des 

revendications 1 a 3 et 12 et 13. 

24) Composition pharmaceutique comprenant un vecteur selon Tune des 
revendications 6 et 7, capable d'exprimer in vivo, un polypeptide selon Tune des 
revendications 1 a 3. 
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25) Composition pharmaceutique selon Tune des rcvendications 21, 23 ci 24, 
caracterisce cn cc qu'elle comprcnd un vehicuie pharmaccutiqucmcni acceptable. 

26) Composition pharmaceutique scion Tunc des rcvendications 21, 23 a 25, 
destinee a la prevention et/ou au traitcmcnt des infections inicrobienncs ou parasitaircs. 

5 27) Composition pharmaceutique selon la revendication 26, caracterisce cn 

ce que les infections microbienncs ou parasitaircs sont des infections d'origincs 
bactcricnncs, dc bacterics Gram-positives ou Gram-negatives, mycobactcricnnes, 
fongiqucs, ou liees a des spirochetes. 

28) Composition pharmaceutique selon la revendication 26, caracterisee en 
10 ce que les infections virales sont des infections liees a des vims a enveloppe, notamment 

les virus HSV et HIV. 

29) Composition pharmaceutique scion Tune des revendications 21, 23 a 25, 
destinee a la prevention et/ou au traitement de cancers, notamment les melanomcs. 

30) Composition pharmaceutique scion la revendication 29, caracterisce en 
15 ce que le cancer est Ic cancer du foic, de la prostate, du poumon non a pctitcs cellules ou 

le carcinome colorectal. 

31) Composition pharmaceutique scion Tune des rcvendications 21, 23 a 25, 
destinee a augmcntcr les defenses immunitaircs, a augmcntcr les defenses immunitaircs 
cn cas d'immunodeficicncc acquisc ou a prevenir Timmunodcficicncc, notamment pour 

20 le traitement du psoriasis. 

32) Composition pharmaceutique selon Tune des revendications 21, 23 a 25, 
destinee a moduler les processus inflammatoires, notamment dans les cas de maladies a 
inflammation chronique. 

33) Methode de diagnostic d'une immunodeficience et/ou d'une 
25 predisposition a des affections de type cancer, caracterisee en ce qu'on met en evidence 

dans un prelevement de patient la presence d'une defensine anormale et/ou d'une 
sequence codant pour une defensine anormale. 

34) Methode de diagnostic d'infections dues a des microorganismes ou liees 
a un deficit immunitaire ou a un phenomene inflammatoire, caracterisee en ce qu'elle 

30 comprend le dosage d'un polypeptide selon Tunc des revendications 1 a 3 ou d'un acide 
nucleique selon Tune des revendications 4 et 5 dans un echanttllon biologique ct la 
comparaison du resultat dudit dosage obtenu avec la quantite dudit polypeptide, 
respectivement dudit acide nucleique, presente normalement dans un echantillon 
biologique equivalent. 
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35) Methode de diagnostic d'inflammaiion, d'unc immunodcficience ci/ou 
d'une predisposition a dcs affections de type cancer, caracterisee en cc qu'cllc comprend 
Ic dosage d'un polypeptide scion Punc dcs revendications I a 3 ou d % un acidc nuclciquc 
scion Punc dcs rcvcndicalions 4 el 5 dans un cchantillon biologiquc et la comparaison du 

5 rcsultat dudil dosage obtenu avec la quantite dud it polypeptide, respect ivement dudii 
acide nuclciquc, prescntc normalemcnt dans un cchantillon biologiquc equivalent. 

36) Methode de diagnostic scion Punc dcs revendications 33 a 35, 
caracterisee en ce qu'cllc met en ceuvrc un anticorps scion Punc dcs revendications 14 ci 

10 37) Methode de diagnostic selon Punc dcs revendications 33 a 35, 

caracterisee en ce qu'ellc met en ceuvre tine sonde et/ou une amorce oligonucleotidique 
selon Pune dcs revendications 16 et 17. 

38) Kit ou nccessaire de diagnostic pour la determination d'une infection 
microbiennc ou parasitaire, d'une inflammation, cPune immunodeficicncc ct/ou de 

15 predisposition a des affections dc type cancer, caractcrisc en ce qu'il comprend un 
anticorps selon Punc dcs revendications 14 ct 15. 

39) Kit ou nccessaire de diagnostic pour la determination d'unc infection 
microbiennc ou parasitaire, d'unc inflammation, d'unc immunodcficience ct/ou dc 
predisposition a dcs affections de type cancer, caractcrise cn cc qu'il comprend une 

20 sonde et/ou une amorce scion Punc dcs revendications 16 ct 17. 

40) Utilisation d'un polypeptide scion Pune dcs revendications 1 a 3.. 12 ct 
13, comme pesticide, notamment pour la culture dc vegctaux d'intcret industriel. 
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ACACCATTTG TCTTCATGTA ACCCCATTAG CTATACCCTC TAGTGCAAGG AAACCATAGG 
10 20 30 40 50 60 

GCCTAGGTCA CACCATGAGG CTGCNCTTAC AAGTTATGCA AAAACTATGG ACTTGGCAGA 
70 80 90 100 110 120 

CCTGTGCGTA ACAACATCAC AC N C CAAATT TAACCACCTC TCCCCATAAC AGCACGCTCA 
130 140 150 160 - 170 100 

TGTGTTACTG AGGAAATGCC TGTGGATTGG AGTGTGTTCT GTGTGCAGGA GGCTGGTCCA 
190 200 210 220 230 240 

GGTTTCACTT CTGCAGGACA CTGGACGTTT CCCAAAACCA GCAGACTTTC CCCACGTGCA 
250 260 270 280 290 300 

CACACACCCC TTCTCATTTT GCCTCTACAT CCATATCCAC TGGGCCCTTC AGGCACCTAC 
310 320 330 340 350 360 

TAATGCCCTA GAACCTAAAA CCATCATCTG GGGCCCAGTT CCCTGAATGG CCCTAATCTC 
370 380 390 400 410 420 

TTCCTCTGCT GGAATGAGTC CAGTGCCCAC TTCCTCCAAC GGTGAAATTG CTGGGCTGCT 
430 440 450 460 470 480 

ACAGATCAGG AACTCACTGC TTCCTCATAG GGGCAGCCGA CTTCACTGCT CTGCAACAGC 
490 500 510 520 530 540 

GACCACCCCT AGCGAGGCTT GAGATGCCTC TTGCCTCCTT AAGACTGAGG GAGACGCTTC 
550 560 570 580 590 600 

AGCTCTCACT CCACTGCCCC AAGTCCTCCA CAGCGCGGTG CCTGCTGCCT TCACACAGAG 
610 620 630 640 650 660 

CTGCAGGGGN AGGTCCTGTG TATCCGGCCT GCTGGACCAG CGCTGTGCAC AACCCTCCCA 
670 680 690 700 710 720 

TGGCAACAGT GGCTGCCCGG CCTGCACACT GGGCTTGGCA ACCTCGCTGT AGGTATTTAT 
730 740 750 760 770 780 

TCCCTCAGGA GTGACTGCAT TCTTTTCCCA TTTCCAGAAA ACT GAT G CCA TTTACCTCAC 
790 800 810 820 830 840 

TATGAGGAGG AGGAGGAGGA GGAGGGTGGA GAGTGGTACA TTTTAAAATG TGCACTATTC 
850 860 870 880 890 900 

TCCCTAGGAC TCCCCCTCAA ATAACCCAGG AGGGACCATA CCAGCTCATT CCTGTGTATC 
910 920 930 940 - 950 960 

C CAAGCAT AN GAGTAATCAT CCCACTCATG CTGAGTGTAT GGTGGCCATT AAGCCTGCCC 
970 980 990 1000 1010 1020 



Figure 1 
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TGAACTGGCT TTAGAACAAG GTGTTTGAGC ACACAGCACC GTCTTGCTGC CACCTTGGCC 
1030 1040 1050 1060 1070 1080 

CCCTCCCTTG TGAGACCTCT GAGACACATT NAGGTCTCAC CTAAAAATCT CAGGATTTCT 
1090 1100 1110 1120 1130 1140 

AGGCCCAAAN CGGTCCTAAA AAATTGTTCA GTCTGAACTC TCTAAGGTCA AGAGAAGACG 
1150 1160 1170 1180 1190 1200 

TGGTTGCTCC CTCTAAGAAA CCACATGTTG CATGTACATC CTTAATTCCG GAAAGTCCAA 
1210 1220 1230 1240 1250 1260 

CAAACCTGCC CTGCTTAGCA ACACAAGCCG AGGTGGTACT CCTCTCACCC GGGCATTCTC 
1270 1280 1290 1300 1310 1320 

CAACACACCT GTTTGTCCAA ACAGCTTTGA TTTGTTTTTA TAGTTGGACC CCAGGTTCCC 
1330 1340 1350 1360 1370 1380 

AGGAGGCTGG TTCAGGCCAT ATTCCAAATC CTCATCTGTG TGTGAGTGGC ATTCTTAGCC 
1390 1400 1410 1420 1430 1440 

TAGCCTCCTT ACAGGGTGGA TACTATGATA CACAGCCAGG CTGTCCCAGT GGCTTTCAAT 
1450 1460 1470 1480 1490 1500 

ATTCTTTTGG TCCAGATAGT TCAGCCTCAG CACCAGTGTA GGCATCACAG GGTCAATTGT 
1510 1520 1530 1540 1550 1560 

CTTAGGAGTC ATGGAGAATT CATAGTTGGT AGCTACCTGG GCCTGGCCAG GGCTGACCAT 
1570 1580 1590 1600 1610 1620 

AGACAAGGCA TCCCTCTGTG AACTCCTATT TTAATGCCAG CTTCCCAACA AATTTCTCAA 
1630 1640 1650 1660 1670 1680 

CAAT box 

CTGCTCTTAC CAGCAGGTAT TTAAACTACT CAATAGAAAG TAACCCTGAA AATTAGGACA 
1690 1700 1710 1720 1730 1740 

TATA box 



CCTGTTCCCA AAAGACCCTT AAATAGGGGA AGTCCTTTCN CTGCTTGTGC ACAGCTGCTG 
1750 1760 1770 1780 1790 1800 

| ->mRNA 

ATGTGGCAAC ATGAGGCCTG GGACAGGGGA CTGTCCTCTG CCCACTCTGG TAGCCTCACG 
1810 1820 1830 1840 1850 1860 

Spsite 

exon 1 >tf#tt#tttf 

TAGCTTAACA ATCTGTCAGT AATACAATAC AAAACTTAAA CTTTCATACT GCGGTTCCAC 
1870 1880 1890 1900 1910 1920 

CCAGGAAGCT GTGTTCCCAA TCTGACCCGT GATTATGGGG CCACCTCAGA GGGNACCCAG 
1930 1940 1950 I960 1970 I960 
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TGAGGGAATA TTTTGCCATC TGGGACTGTT 

1990 2000 2010 

TTAATAAACT CAAGCAGTTT CCTTCCAAAC 

2050 2060 2070 



GGTTGCTGGG GGCAGTGGCT ATGAGCTCAG 
2020 2030 2040 

ACACATGTCC TACTTAACGT GTCCAACAGA 
2000 2090 2100 



GAT GAT CAT A CTCATANGCT GCTAAAACAT 
2110 2120 2130 

Alu insert 

TTCTTGGCCC ATGGAGTTTT CATTTNATTA 
2170 2180 2190 



TANTTTTATT TT G AG AAAAG TCTATTCATG 
2140 2150 2160 



NTTTATTTAT TTTGCAGAGA TGGAGTCTCA 
2200 2210 2220 



CTATGTTGCT CAAGCTGGTC TCCAACTCCT GGGCTCAAGC GATCTTCCTA CTTTGGCCTT 
2230 2240 2250 2260 2270 2280 



TGAAAGCGCT GAGATTGCCT GTGTGAGCCA TCATGGGGGC TCACTGGCCC ACTGATTAAT 
2290 2300 2310 2320 2330 2340 

CAGATTAATT GTTTTTTGCT ATTGAANTTG TTTGACTTCC TTGTATATTC GGATATTTAC 
2350 2360 2370 2380 2390 2400 

CCATTCTAAC ACGTAGGGTT TGCAAATATT TTCTCTCATG TTCTGTGTTG CCTTTTCACT 
2410 2420 2430 2440 245C 2460 

CAGTTGATGG TTTCCTTTGC TGTGCAGGTG CTTTAGTGTT CAACGCAGCC CCGCTTGTCT 
2470 2480 2490 2500 2510 2520 

ATTTTCCATT TTATTGCCTG TCCCTTTGAT GTCATAGCCA AGAAATAATT GCCCAGATTA 
2530 2540 2550 2560 2570 2580 

ATGTCAAAAA GCTTTATCCC TATATATTCT TCTAGTAGTT TATGGTTTCA GATCTTATGT 
2590 2600 2610 2620 2630 2640 

TTAGGTCTTC AATCCATTGA GTTGATTTTT GTATGTGGTA TAAGAAAAAA GACCACATGT 
2650 2660 2670 2680 2690 2700 

ATACATATCT CAAATTCTAA GGTAGTATAT ATTAGACACA TACAATGTGT CTATTTACAC 
2710 2720 2730 2740 2750 2760 

AC ATT GAG CT GAAAATAATA AACATATTTT TATCTTTCAA TCAACTCTAT CTCTATCTCA 
2770 2780 2790 2800 2810 2820 

CTGAACTTGT TTCACCTATA GCCTGATGAG GTTGCTGTCC TCTCTACCCC AGCTCCTATA 
2830 2840 2850 2860 2870 2880 

GGAGACTGCT CATCCCCTAA CCTCAAAAAC CCCTTCATGA GGGTGATAAT GCCCTTGAAT 
2890 2900 2910 2920 2930 2940 



Figure 1 (suite) 
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CCTGCAATGA ATTAGTTCTC TACTACAGTG GAATTCAGGT CTGTTATGAG GGTCTGGATC 
2950 2960 2970 29B0 2990 3000 

TCTGAAGAGA AGAGCTCTCA TTTTCAGAAA ATAAGCAGCA TTTATTCCCT GAAATTACTG 
3010 3020 3030 3040 3050 3060 

AATTAAATCA CTGTTTCGAT TACT7TTTGC AATATTAAAA GTAAATATTT AAACAGGTAA 
3070 3000 3090 3100 3110 3120 

AAACAGAAAT AATGGTAGGG TCCTTATCAT CACCGTGAAT TCCAAGCTAG CATAGACACT 
3130 3140 3150 3160 3170 3180 

AAACCTAGAG ATTCACACTA GAATGAAAGC TGGGAGAGCA GAGGAGTCTC AGAAGGATGT 
3190 3200 3210 3220 3230 3240 

GGAGGCCAAT GGACACCTGC AACCTCTCCA ACGAAATGCC TACCTCCTCT CACTGCAGCA 
3250 3260 3270 3280 3290 3300 

TCCATCTCTG AGCCTTCTCG CAGCAGAGCT ATAAATTCAG CCTGGCTCCT CCGTTCCCAC 
3310 3320 3330 3340 3350 3360 

Spsite CDS start 

tt«8< *** 

ACATCCACTC CTGCTCTCCC TCCTCTCCTC CAGGTGACTA CAGTTATGAG GACCCTCACC 
3370 3380 3390 3400 3410 3420 

? Exon 2 

CTCCTCTCTG CCTTTCTCCT GGTGGCCCTT CAGGCCTGGG CAGAGCCGCT CCAGGCAAGA 
3430 3440 3450 3460 3470 3480 



GCTCATGAGA TGCCAGCCCA GAAGCAGCCT CCAGCAGATG ACCAGGATGT GGTCATTTAC 
3490 3500 3510 3520 3530 3540 

Spsite 

>««« ««« 

TTTTCAGGAG ATGACAGCTG CTCTCTTCAG GTTCCAGGTG AGAGATGCCA GCATGCAGAG 
3550 3560 3570 3580 3590 3600 

CTACAGACTA GACAGAAGGA CAGGAGACAG GCTCTGGAAT TGGATCTCAG TGGCAGATGT 
3610 3620 3630 3640 3650 3660 

CACTTAGGTG GCTATACTTA ACATCTCTGG TCCTGGATTT TCTCATATCT AAATGGAATA 
3670 3680 3690 3700 3710 3720 

G AG AAC C AAA GAAATCTAAG AGATTTTTCT TTCTCCAAAA ACTTGATTCC AAG AT AT G AC 
3730 3740 3750 3760 3770 3780 

TGTGAAATTC ACTAGATTTA AGATATAAGG AGATGCTACC TAGTTCCTTC TGGAGCCAGA 
3790 3800 3810 3820 3830 3840 
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CAAACAAGCT TAAGTATATA GGAAAATATT 
3850 3860 3870 

CTGGAGAGGA GCCTAAGAAT GTGTTCAGGT 
3910 3920 3930 

TGAAGCAAAG GAGAATGAGT CTCGAATCCT 
3970 3980 3990 

CCTATTGACT GAGATTGTTT GTGCTACCGG 
4030 4040 4050 



TCACCCTGTC TAT AT AG GAG GTTTTAGAAC 

3890 3890 3S00 

GTGTGTGTGA TGGGCAGGAA TGCAGAAAAG 

3940 3950 3960 

GTGTGACCAG CACTGCTCTG TGTATTTATT 

4000 4010 4020 

CTGTAATACA GCCAACATCA CTCATCAGCC 

4060 4070 4080 



AACATGTGAC TTCTCCAAGA TTCCCTTTAC CACCCACTGC TGNACCCCGT ACTCAGTTTC 
4090 4100 4110 4120 4130 4140 

Spsite 

«««< 

TGATGCTCTC TCTGGGTCCC CAGGCTCAAC AAAGGGCTTG ATCTGCCATT GCAGAGTACT 
4150 4160 4170 4180. 4190 4200 

Exon 3 

ATACTGCATT TTTGGAGAAC ATCTTGGTGG GACCTGCTTC ATCCTTGGTG AACGCTACCC 
4210 4220 4230 4240 4250 4260 

CDS stop 



AATCTGCTGC TACTAAGCTT GCAGACTAGA GAAAAAGAGT TCATAATTTT CTTTGAGCAT 
4270 4280 4290 4300 4310 4320 

Poly Ad 



TAAAGGGAAT TGTTATTCTT ATACCTTGTC CTCGATTTCC TGTCCTCATC CCAAATAAAT 
4330 4340 4350 4360 4370 4380 

ACTTGGTAAC ATGATTTCCG GGTTTTTTTT TTTTT 
4390 4400 4410 
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DEF4 
DEFX 



10 20 30 40 50 

GGATCCCCATTTGTCTTCAGTGTAACCC-ATTAGTTAAACCGCCTACTGCAAGGAAACCA 



ACACCATTTGTCTTCA-TGTAACCCCATTAGCTATACCCTCTAGTGCAAGGAAACCA 
10 20 30 40 50 



60 70 80 90 100 110 

DEF4 CAAGGCTTGGATCAGATCATGAGGCTGCCCT-ACAAGTTATGCCAAAAAATATGGACTTG 

DEFX TAGGGCCTAGGTCACACCATGAGGCTGCNCTTACAAGTTATGC-AAAAACTATGGACTTG 
60 70 80 90 100 110 

120 130 140 150 160 170 

DEF4 GAAGACCTGTCTGTTATAATATCACAC - CCAAATCTAACCAGCTCTGCCAATAACAGCTC 

DEFX GGAGACCTGTGCGTAACAACATCACACNCCAAATTTAACCAGCTCTCCCCATAACAGCAC 
120 130 140 150 160 170 

180 190 200 210 220 230 

DEF4 TCTCCTATGTTACTAGGAAAATGCCTATGGATTGGAGTGTGTTCTGTGTGCAGGAGGCTG 

• • • • •••■■•« • «•••••••••••••«•••••••••«••••»««* 

• • •••••■••»*••••••••••••«*••«••»« (a 

DEFX GCTCATGTGTTACTGAGGAAATGCCTGTGGATTGGAGTGTGTTCTGTGTGCAGGAGGCTG 

180 190 200 210 220 230 



DEF4 
DEFX 



240 250 260 270 280 290 

GTCCAGGTTTCACTTCTGCAGGACACTGGACATC-CCCACAACCACCAGACCTTCCCCAC 



GTCCAGGTTTCACTTCTGCAGGACACTGGACGTTTCCCAAAACCAGCAGACTTTCCCCAC 
240 250 260 270 280 290 



300 310 320 330 340 350 

DEF4 GTGCACACACACCCCTTCTCATTTTGCCTCTACATCCATATCCACTGGGCCCTTCAGGCA 

DEFX GTGCACACACACCCCTTCTCATTTTGCCTCTACATCCATATCCACTGGGCCCTTCAGGCA 
300 310 320 330 340 350 



DEF4 
DEFX 



360 370 380 390 400 410 

CCTACTAATGCCCTAGAACCTAAAACCATCATCTGGGGCCCAGTTCCCCAAATAGCCCTA 



CCTACTAATGCCCTAGAACCTAAAACCATCATCTGGGGCCCAGTTCCCTGAATGGCCCTA 
360 370 380 390 400 410 



420 430 440 450 460 470 

DEF4 ATTTCTTCCTCTGCTGGAATGAGTCCAGTGCCCACTTCCTCCAAAGGTGAAATTGCTGGG 

DEFX ATCTCTTCCTCTGCTGGAATGAGTCCAGTGCCCACTTCCTCCAACGGTGAAATTGCTGGG 
420 430 440 450 460 470 

480 490 500 510 520 530 

DEF4 CCTGCAACAGATCAGGAACTCACTGCTTC-TCATAGGGGCAGCCGACTTCACTGCTCTGG 

DEFX C-TGCTACAGATCAGGAACTCACTGCTTCCTCATAGGGGCAGCCGACTTCACTGCTCTGC 
480 490 500 510 520 530 



Figure 2 
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540 550 560 570 580 590 

DEF4 AACAGCGACCACCCCTAGCGAGGCTTGAGATGCCTCTTCCCTCCTTAAGACTGAGAGCGC 



DEFX AACAGCGACCACCCCTAGCGAGGCTTGAGATGCCTCTTGCCTCCTTAAGACTGAGGGACA 
540 550 560 570 500 590 

600 610 620 630 

DEF4 CGCT GCCCCCAGTCCTCCATAGCCCAGTGCCTGGCTGCCTTCA 



DEFX CGCTTCAGCTCTCACTCCACTGCCCCAAGTCCTCCACAGCGCGGTGCCTG-CTGCCTTCA 
600 610 620 630 640 650 

640 650 660 670 680 690 

DEF4 GCCAGAGCTGCAGGGG-AGGCCCTGAGCACCCAAGTCCTGCTGGACCAGCGCTGTGCACG 



DEFX CACAGAGCTGCAGGGGNAGGTCCTGTGTATCC--GGCCTGCTGGACCAGCGCTGTGCACA 
660 670 680 690 700 710 

700 710 720 730 740 750 

DEF4 GCCCTCCCATGGCGGCAGGGGCTGCCTGGACTGCATACTGGGTTCAGCAACCTCACTATA 

DEFX ACCCTCCCATGGCAACAGTGGCTGCCCGGCCTGCACACTGGGCTTGGCAACCTCGCTGTA 
720 730 740 750 . 760 770 

760 770 780 790 800 810 

DEF4 GGTATTCATTCCCTCAGGAACAACTGCATTCTTTTCTCATTTCCAGAAACCTCATCCCGT 



DEFX GGTATTTATTCCCTCAGGAGTGACTGCATTCTTTTCCCATTTCCAGAAAACTGATGCCAT 
780 790 800 810 820 830 

820 830 840 850 860 

DEF4 TTACCTCACTACAAGGAGGAGGATG GT G G AGAGT G GT AC ATTTT AAAATGT 



DEFX TTACCTCACTATGAGGAGGAGGAGGAGGAGGAGGGTGGAGAGTGGTACATTTTAAAATGT 
840 850 860 870 880 890 

870 880 890 900 910 920 

DEF4 GCACTAGTCTCCCTGGGACTCCCCTTCAAATAACCCAGGAGGGACCACACAAGGGAAAGC 



DEFX GCACTATTCTCCCTAGGACTCCCCCTCAAATAACCCAGGAGGGACCATACCAGCTCATTC 
900 910 920 930 940 950 

930 940 950 960 970 980 

DEF4 TTATGCATCCCCCCCACCC-AGTGACCATCTTCCTAACTCTGGGTGTAGGGAGACTCGTA 

* * I lilt! » ■• • I ! ! I • • • ■ ■ • • I • ■ "!*•• • • • ■ ■» 

DEFX CTGTGTATCCCAAGCATANGAGTAATCATCGCACTCATGCTGAGTGTATGGTGGCCATTA 
960 970 980 990 1000 1010 

990 1000 1010 1020 1030 1040 

DEF4 AGCCTACG — GGATTGGTTTGGGAACAGGGTATTTGAGCTCACAACACAAGGTGATGCAA 

DEFX AGCCTGCCCTGAACTGGCTTTAGAACAAGGTGTTTGAGCACACAGCACCG 

1020 1030 1040 1050 1060 



Figure ■ 2 ( suite) 
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DEF4 
DEFX 



1050 1060 1070 1080 1090 1100 

GCTAACACCAATCTCGCTGCAGCTTTGGCCACCATCCTAAGG-GACTTCTGACAGACATT 



-TCTTGCTGCCACCTTGGCCCCCTCCCTTGTGAGACCTCTGAGACACATT 
1070 1000 1090 1100 1110 



DEF4 
DEFX 



. 1110 1120 1130 1140 1150 1160 

-AGGTGTCACGCAATCATTTGATGAGTCCTTGGCCTGGAT - - GACCTAGACACTCATTTA 



NAGGTCTCACCTAAAAATCTCAGGATTTCTAGGCCCAAANCGGTCCTAAAAAATTGTTCA 
1120 1130 1140 1150 1160 1170 



1170 1180 1190 1200 1210 1220 

DEF4 GGCTTGAACTATCTAAGGCCAAGCAAAAAGGTGACTGTCCCCTCTAGGAA-CCACATGCT 

DEFX GTCT-GAACTCTCTAAGGTCAAGAGAAGAGGTGGTTGCTCCCTCTAAGAAACCACATGTT 
1180 1190 1200 1210 1220 



DEF4 
DEFX 



1230 1240 1250 

ATATGCACATCCTTTACTCGGGAGCCTGCAAO 



1260 1270 
-CTGCCCTATCCAGCAACACAAGCC 



GCATGTACATCCTTAATTCCGGAAAGTCCAACAAACCTGCCCTGCTTAGCAACACAAGCC 
1230 1240 1250 1260 1270 1280 



1280 1290 1300 1310 1320 1330 

DEF4 CAGGCG-TATTCAGTCTCATCCAGGTATTCTCCAAC CTTACTTGTCTGAATGGCTTG 

■ • t * •• ••••• »• •• •■•••••■•« • a I'll* ! ■ *«*• 

DEFX GAGGTGGTACTCC-TCTCACCCGGGCATTCTCCAACACACCTGTTTGTCCAAACAGCTTT 
1290 1300 1310 1320 1330 1340 



DEF4 
DEFX 

DEF4 
DEFX 

DEF4 
DEFX 

DEF4 
DEFX 



1340 1350 1360 1370 1380 1390 

GATTTGTTTTTATGGTTAGACCCCAGGG-CCTGGGAGGTCAGTTCAGACCACATTCCA/vA 



GATTTGTTTTTATAGTTGGACCCCAGGTTCCCAGGAGGCTGGTTCAGGCCATATTCCAAA. 
1350 1360 1370 1380 1390 1400 

1400 1410 1420 1430 1440 1450 

TCCTCATCTGTGTGTGGGTGGCATTTTGATCCTAGTCTCCTCGCAAGGTGTATACAACAA 



TCCTCATCTGTGTGTGAGTGGCATTCTTAGCCTAGCCTCCTTACAGGGTGGATACTATGA 
1410 1420 1430 1440 1450 1460 

1460 1470 1480 1490 1500 1510 

TATGCAGGCCAGGCTCTCCTGGTGGCTTTAAATATTCCCTCGGTCCAGGTAGTTCAGCCT 



TACACAG-CCAGGCTGTCCCAGTGGCTTTCAATATTCTTTTGGTCCAGATAGTTCAGCCT 
1470 1480 1490 1500 1510 152C 

1520 1530 1540 1550 1560 1570 

CAGCCACCAGCATAGGTATCATGGGGTCAATTGTCTTAGGAGTCATGAGGAATCCACAGT 



CAGC-ACCAGTGTAGGCATCACAGGGTCAATTGTCTTAGGAGTCATGGAGAATTCATAGT 
1530 1540 1550 1560 1570 1580 



Figure 2 (suite) 



WO 99/11663 



PCT/FR9 8/0 1864 



9/16 



1580 1590 1600 1610 1620 1630 

DEF4 TGATTGCTGCCTGGGCCTGGCCAGGGCTGACCAAAGTAGACGAGGGGTCGGTACCTCCGT 

DEFX TGGTAGCTACCTGGGCCTGGCCAGGGCTGACCA TAGACAAGGCATC CCTCTGT 

1590 1600 1610 1620 1630 

1640 1650 1660 1670 1600 1690 

DEF4 GGACTCCTGCTTGAACTCCAGCTTTCTGCCAAATTTCTCAACTGCCCTTCTTAACAGTTA 
> •••••• •• ••■••«• * *•••*••>••••*••■ » • * ■ t* 

DEFX GAACTCCTATTTTAATGCCAGCTTCCCAACAAATTTCTCAACTGCTCTTACCAGCAGGTA 
1640 1650 1660 1670 1680 1690 

CAAT box 

1700 1710 1720 1730 1740 1750 

DEF4 TTTAAAGTACCCAATAGAAAGTAACGCTGAAAAATTAGGACACCTGATACCAAAAGACCC 



DEFX TTTAAACTACTCAATAGAAAGTAACCCTGAAAA-TTAGGACACCTGTTCCCAAAAGACCC 
1700 1710 1720 1730 1740 1750 

TATA box 

1770 1780 1790 1800 

DEF4 TTAAATAAGG-AAGTCCTCTC-CTCTGTGTGCATGGCTGCTCTTG CTACATAAGACC 



DEFX TTAAATAGGGGAAGTCCTTTCNCTGCTTGTGCACAGCTGCTGATGTCGCAACATGAGGCC 
1760 1770 1780 1790 1800 1810 

mRNA start — > SpSite 

1610 1820 . I 1830 1840 1850 1860 

DEF4 TGGAACACAGGACTGCTGTCTGCCCTCTCTGCTCGCCCTGCCTAGCTTGAGGATCTGTAA 

• » • ••• •••••• ••••••• • • • • ■ ••••<■ • •••*•• • 

• ■ • aaa •••••a a a a a a a a aaaaa • aaa • a a a a a a * • 

DEFX TGGGACAGGGGACTGTCCTCTGCCCACTCTGGTAGCCTCACGTAGCTTAACAATCTGTCA 
1820 1830 1840 1850 1860 1870 

1880 1890 1900 1910 1920 

DEF4 GTAACACAA AACTTAAACTTTCAGATTGAGGTTTCAATATTGAAGCTGTGTCCCC 

• aaa Z a a a •••••••••••••• a at 5 a a a a* aaaaaaaaaa aaa 

DEFX GTAATACAATACAAAACTTAAACTTTCATACTGCGGTTCCACCCAGGAAGCTGTGTTCCC 
1880 1890 1900 1910 1920 1930 

1930 1940 1950 1960 19.70 .1980 

DEF4 AGTCTGACCTCTCACTGTGGGGCCACCCCAGAGGACCCAGCGTGAAGCCCCTGCTGTGAA 

• ••*•••• • a • •••••• • a*«a • a • 

< ••••••• a a • aaaaaaaaaa •••••• a t » • • a a a a aa 

DEFX AATCTGACCCGTGATTATGGGGCCACCTCAGAGGGNACCCAGTGAGGGAA-TATTTTG — 
1940 1950 1960 1970 1980 1990 

1990 2000 2010 2020 2030 2040 

DEF4 CTTCTATCTGGGTGTCTGGCGGCTGCTGGGGGTAATGGCTACTAGCTAAGTCAATAGAGA 

DEFX CCATCTGGGA — CTGTTGGTTGCTGGGGGCAGTGGCTATGAGCTCAGTTAATA-- 

2000 2010 2020 2030 2040 
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2050 2060 2070 2080 2090 2100 

DEF4 AACTCAAAAAGTTTCCTTCCAAACACACGTGTCCTACTTGACATGTCCAATAAAGACGAT 

,.»♦.». .«•••«•••• ••••••• • 4 • • m « a 

•• • ••• * • • 

DEFX AACTCAAGCAGTTTCCTTCCAAACACACATGTCCTACTTAACGTGTCCAACACAGATCAT 
2050 2060 2070 208C 2090 2100 

2110 2120 2130 2140 
DEF4 CA CAGCTTCT--TAAAACATTA-TTTTATTGTGAGAGAAGCCTCT 



DEF4 



• • • • 



DEFX CATACTCATANGCTGCTAAAACATTANTTTTATTTTGAGAAAAGTCTATTCATGTTCTTG 
2110 2120 2130 2140 2150 2160 

2150 

DEF4 GCAG GTC CTA 

DEFX GCCCATGGAGTTTTCATTTNATTANTTTATTTATTTTGCAGAGATGGAGTCTCACTATGT 
2170 2180 2190 2200 2210 2220 

2160 

DEF4 GGTCT GTTTTTC 



DEFX TGCTCAAGCTGGTCTCCAACTCCTGGGCTCAAGCGATCTTCCTACTTTGGCCTTTGAAAG 
2230 2240 2250 2260 2270 2280 



2170 
-AATCAGGTT 



DEFX CGCTGAGATTGCCTGTGTGAGCCATCATGGGGGCTCACTGGCCCACTGATTAATCAGATT 
2290 2300 2310 2320 2330 2340 

21B0 2190 2200 2210 2220 2230 

DEF4 GTTTGTTTTTTGCTATTGA- GTTGTTTGACTTCCTTATGTATTCAGATATTTACCCCTTC 

DEFX AATTGTTTTTTGCTATTGAANTTGTTTGACTTCCTTGTATATTCGGATATTTACCCATTC 
2350 2360 2370 2380 2390 2400 

2240 2250 2260 2270 2280 2290 

DEF4 TACCACGTAGGCTTTGCAAACATTTTCTCTCATTTTCTGGGTTGCCGTTTCCCTCAGTTG 

: : :::::::: :::::::: 

DEFX TAACACGTAGGGTTTGCAAATATTTTCTCTCATGTTCTGTGTTGCCTTTTCACTCAGTTG 

2410 2420 2430 2440 2450 2460 

2300 2310 2320 2330 2340 2350 

DEF4 ATTGTTTCCTTTGCTATGAAGATGCTTTAGCGTTCAATGCAGCCCCGCTTGTCTATTTTC 

DEFX ATGGTTTCCTTTGCTGTGCAGGTGCTTTAGTGTTCAACGCAGCCCCGCTTGTCTATTTTC 
2470 2480 2490 2500 2510 2520 

2360 2370 2380 2390 2400 2410 

DEF4 CCATTTGTTTATTGCCTGTGCCTTTGGTGTCATAGCCAAGAAATCATTACTCACGTCAAT 

DEFX C-ATTT T ATT GCCT GT CCCTTTG ATGT C AT AGCCAAGAAATAATT G C CC AGATTAAT 

2530 2540 2550 2560 2570 2580 
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2420 2430 2440 2450 2460 2470 

DEF4 GTCCAAA-GCTTTATCTTTGTATGTGCTTCTCGTAGTTGTATGGTTTCAGGTCTTTTCAA 

• •• ••• • ••• » •••••• •«••• •••• 

••• ••■•••*• « • ••••« ••«■•• ••••••••••• 

DEFX GTCAAAAAGCTTTATCCCTATATATTCTTCTAGTAGTT - TATGGTTTCAGATCTT 

2590 2600 2610 2620 2630 

2480 2490 2500 2510 2520 2530 

DEF4 GTCTATGTTGAG-TCTTCAATCCATGTTGAGCTGATTTTT-TACATGTTGTGAGAGAAAG 

• •«••••••••« ••••• •••••••• * ■ » • • * • • • 

• • • • • • • a • a a • ■ * . . • ■ a a a ••■ 

DEFX ATGTTTAGGTCTTCAATCCA--TTGAGTTGATTTTTGTATGTGGTATAAGAAAAAA 

2640 2650 2660 2670 2680 2690 

2540 

DEF4 GACCACGTGTATGCACCT 



DEFX GACCACATGTATACATATCTCAAATTCTAAGGTAGTATATATTAGACACATACAATGTGT 
2700 2710 2720 2730 2740 2750 

2550 2560 2570 
DEF4 AGC AACTCATGAAC : CTTACA — CAACTCTTT 

DEFX C T AT TT AC AC ACATT G AG CT G AAAAT AAT AAACAT ATTTTT AT CTTT CAAT C AA CT CT AT 
2760 2770 2780 2790 2800 2810 

2580 2590 2600 2610 2620 2630 

DEF4 ATCTCTCTCACTGAGCTCATTTCACCTGTACCCTGATAAGGTCATTGTCCTCTTCACTCT 



DEFX CTCTATCTCACTGAACTTGTTTCACCTATAGCCTGATGAGGTTGCTGTCCTCTCTACCCC 
2820 2830 2840 2850 2860 2870 

2640 2650 2660 2670 2680 2690 

DEF4 GGCCCCTACAGGAGACTACTCACCCCATTACCTCAGTCGCCCCTTCATGAGGGT-ATAAT 



DEFX AGCTCCTATAGGAGACTGCTCATCGCCTAACCTCAAAAACCCCTTCATGAGGGTGATAAT 
2880 2890 2900 2910 2920 2930 

2700 2710 2720 2730 2740 2750 

DEF4 GACCTAGAAGCCTGCAATGAGTTACT-CTCTACTCCACCGGAATTCAGGTCTGGCACCAG 

• •■• ,.,♦...».. * » » ■ ■ • • a a a a ■• •«*•■»•••••••• » 

• ••• ••* •••«*••••• a a a • • • a a • a • •* »•«••#•••••••• • a a 

DEFX GCCCTTGAATCCTGCAATGAATTAGTtCTCTACTACAGTGGAATTCAGGTCTGTTATGAG 
2940 2950 2960 2970 2980 2990 

2760 2770 2780 2790 2800 2810 

DEF4 TGTTTAGACCT — GAAGAGAATAGTAGGGCCCATTATCAGGAAATAAGAGGCATTTGCTC 



DEFX GGTCTGGATCTCTGAAGAGAAGAG CTCTCATTTTCAGAAAATAAGCAGGATTTATTC 

3000 3010 3020 3030 3040 

2820 2830 2840 2850 2860 2870 

DEF4 TCTTAAATTATTGAATGAAAGCACTGTTTCCATT-CTTTTTAGAATATTAAAGATTTAAC 



DEFX CCTGAAATTACTGAATTAAATCACTGTTTCGATTACTTTTTGCAATATTAAA' 
3050 3060 3070 3080 3090 
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2800 2890 2900 2910 2920 293C 

DEF4 CAGGAAATATTAGGTATTTCCTGAAAACAGGAAAAAATGCCAGGGTCCTCATCATCACCA 

DEFX -AGTAAATATTTA- ~AACAGGTAAAAACAG- AAATAATGGTACGGTCCTTATCATCACCG 
3100 3110 3120 3130 3140 3150 

2940 2950 2960 2970 2980 
DEF4 TCAACTTCAACCTAGGCACAGACACTAAACATAGAGCTTC CTGTGAAGAAAGCTGGG 

DEFX TGAATTCCAAGCTAG-CATAGACACTAAACCTAGAGATTCACACTAGAATGAAAGCTGGG 
3160 3170 ■ 3100 3190 3200 3210 

2990 3000 3010 3020 3030 3040 

DEF4 AG AG C AGAG GAG G C ATT C CAG GG AT GT CAA G G C C AAT AG G AG T C G G CAT C CT C T C T AAC A 

■ ••••••■•••a • ■ « • • ••• •••••• 4 • • 

»«■»•••••••• • • « •«•«•< *. • ••• 

DEFX AGAGCAGAGGAGTC-TCAGAAGGATGTGGAGGCCAATGGACACCTGCAACCTCTCCAACG 
3220 3230 3240 3250 3260 3270 

3050 3060 3070 3080 3090 3100 

DEF4 AAATGCACACCTCCTCTCACTCAGAAGGCCAAAGGTTTCTTATCTCTGTGCCTTCTCCCA 

■ • • • • • • •«••■•• 

(•■••• ■• • * • • »»•••••• » • 

DEFX AAATGCCTACCTCCTCTCACT GC AGCATCC — ATCTCTGAGCCTTCTCGCA 

3280 3290 3300 3310 3320 

3110 3120 3130 3140 3150 3160 

DEF4 GAA-AGCTATAAATCCAAGCTGGCTTCTCCCTCCCCACACAGCTGCTCCTGCTCTCCCTC 

DEFX GCAGAGCTATAAATTCAGCCTGGCTCCTCCGTTCCCACACATCCACTCCTGCTCTCCCTC 
3330 3340 3350 3360 3370 3380 

< exon2 

3170 3180 3190 3200 3210 3220 

DEF4 CTC CAGGTCACCCCAGCCATGAGGATTATCGCCCTCCTCGCTGCTATTCTCTTGG 

DEFX CTCTCCTCCAGGTGACTACAGTTATGAGGACCCTCACCCTCCTCTCTGCCTTTCTCCTGG 
3390 3400 3410 3420 3430 3440 



3230 3240 3250 3260 3270 3280 

DEF4 TAGCCCTCCAGGTCCGGGCAGGCCCACTCCAGGCAAGAGGTGATGAGGCTCCAGGCCAGG 

• ••••* • #••••• •• •••••••••«••• » ••••• 1 ! ! I ill. 

DEFX TGGCCCTTCAGGCCTGGGCAGAGCCGCTCCAGGCAAGAGCTCATGAGATGCCAGCCCAGA 
3450 3460 3470 3480 3490 3500 



3290 3300 3310 3320 3330 3340 

DEF4 AGCAGCGTGGGCCAGAAGACCAGGACATATCTATTTCCTTTGCATGGGATAAAAGCTCTG 

:::::: : : : : : :::::::: : : : : : : : : : : : : : : : : : : : : 

DEFX AGCAGCCTCCAGCAGATGACCAGGATGTGGTCATTTACTTTTCAGGAGATGACAGCTGCT 
3510 3520 3530 3540 3550 3560 
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3350 3360 3370 3360 3390 3400 

DEF4 CTCTTCAGGTTTCAGGTGAGAGAGGCCAGCATAAAAAAGCTACCGAGTCTAGAGAGACGG 



DEFX CTCTTCAGGTTCCAGGTGAGAGATGCCAGCATGCAGA-GCTAC — AGACTAGACACAAGG 
3570 3580 3590 3G00 3610 

3410 3420 3430 3440 3450 3460 

DEF4 ATGGGAGATGGGCTCTGGAATCACATCTCAATGGTGCATGTCACTTAGGTGGCTTTACTT 
i * i • • * •*••••*■••• «••••• ■ * * ••«••■•••••••••••• «•*•* 

DEFX ACAGGAGACAGGCTCTGGAATTGGATCTCAGTGGCAGATGTCACTTAGGTGGCTATACTT 
3620 3630 3640 3650 3660 3670 

3470 3480 3490 3500 3510 3520 

DEF4 ACCATCTCTGGGCCTCGATTTTCTTATCTCGAAACTGAATAGAGAGACAAACAAATGTAA 

DEFX AACATCTCTGGTCCTGGATTTTCTCATATCTAAATGGAATAGAGAACCAAAGAAATCTAA 
" 3680 3690 3700 3710 * 3720 3730 

3530 3540 3550 3560 3570 3580 

DEF4 GT-AGTCTTCTTTCTCCAAAGACTTGATTCCAAGGTATGTCTATAAAATTCGCTAGGGTT 

DEFX GAGATTTTTCTTTCTCCAAAAACTTGATTCCAAGATATGACTGTGAAATTCACTAGATTT 
3740 3750 3760 3770 3780 3790 

3590 3600 3610 3620 3630 

DEF4 AAGATATGGAGAGACAGATTGACCAGTTCTTTCTGGATCTAAACAAGTA-GAT--ATTAT 

DEFX AAGATATAAGGAGATG — CTACCTAGTTCCTTCTGGAGCCAGACAAACAAGCTTAAGTAT 
3800 3810 3820 3830 3840 3850 

3640 3650 3660 3670 3680 3690 

DEF4 AG-GGAAAATATTTCATTCTGCCAACAAAGGAAATTTTAAAAACTGGAGATGGGCTTAAG 
• •••«•«••■«••• ••• • • • ■ ■ • • •• • • • • • • • • •« • • • • 

« ■••••••••■*•• • • • •••• <>••• • •••• 

DEFX .. ATAGGAAAATATTTCACCCTGTCTATATAGGAGGTTTTAGAACCTGGAGAGGAGCCTAAG 
3860 3870 3880 3890 3900 3910 

3700 3710 3720 3730 3740 3750 

AGTATGTTCAGGTGTGTGTCTGATGGGGCA — AAAG C AC ACAAAT C AG AG C AAAAG AG AA 
', , »•••»»« ■• «• • • • »■•••• • ■ • • ■ 

AATGTGTTCAGGTGTGTGTGTGATGGG-CAGGAATGCAGAAAAGTGA-AGCAAAGGAGAA 
3920 3930 3940 3950 3960 3970 

3760 3770 3780 3790 3800 3810 

TGAGTCTCAAATCCTGTATGAGCAGCATTGCTCTGTGTATTTATTCCTATTGACTAAGGT 



TGAGTCTCGAATCCTGTGTGACCAGCACTGCTCTGTGTATTTATTCCTATTGACTGAGAT 
3980 3990 4000 4010 4020 4030 

3830 3840 3850 3860 3870 

TGTTTGTGCTACCGGCACTAATGCAGCCAGCATCACCGGTCAGCCAGCATGTGCATTCTC 

TGTTTGTGCTACCGGCTGTAATACAGCCAACATCACTCATCAGCCAACATGTGACTTCTC 
4040 4050 4060 4070 4080 4090 



DEF4 
DEFX 

DEF4 
DEFX 

3820 
DEF4 

DEFX 
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3880 3890 3900 3910 3920 3930 

DEF4 CAAGATTCCCTTTACCACCCACCGCTGACCTTGGTGCTTAATTTCTCAGTCTTCCTCTGT 

: : : : . : : : : : : : : : : : : : : : : : : : 
DEFX CAAGATTCCCTTTACCACCCACTCCTGNACCCCGTACTCAGTTTCTGATGCTCTCTCTGG 
4100 4110 4120 4130 4140 4150 

< cxon3 

3940 3950 3960 3970 3980 3990 

DEF4 GTTCCCAGGCTCAACAAGGGGCATGGTCTGCTCTTGCAGATTAGTATTCTGCCGGCGAAC 

• • • ! is si;;; I S t I ! I • • 

DEFX GTCCCGAGGCTCAACAAAGGGCTTGATCTGCCATTGCAGAGTACTATACTGCATTTTTGG 
4160 4170 4180 4190 4200 4210 

exon3 

4000 4010 4020 4030 4040 4050 

DEF4 AGAACTTCGTGTTGGGAACTGCCTCATTGGTGGTGTGAGTTTCACATACTGCTGCACGCG 

DEFX AGAACATCTTGGTGGGACCTGCTTCATCCTTGGTGAACGCTACCCAATCTGCTGCT 

4220 4230 4240 4250 4260 4270 

exon3 

4060 4070 4080 4090 4100 4110 

DEF4 TGTCGATTAACATTCTGCTGTCCAAGAGAATGTCATGCTGGGAACGCCATCATCGGTGGT 

DEFX ACTAA 

exon3 

4120 4130 4140 4150 4160 4170 

DEF4 GTTAGCTTCACATGCTTCTGCAGCTGAGCTTGCAGAATAGAGAAAAATGAGCTCATAATT 

DEF v GCTTGCAGACT AGAGAAAAA- GAGTTCATAATT 

4280 4290 4300 

exon3 

4180 4190 4200 4210 4220 4230 

DEF4 TGCTTTGAGAGCTACAGGAAATGGTTGTTTCTCCTATACTTTGTCCTTAACATCTT-TCT 



DEFX TTCTTTGAGCATTAAAGGGAATTGTTATT CTTATACCTTGTCCTCGATTTCCTGTCC 

4310 4320 4330 4340 4350 4360 

Poly Ad 

> 

4240 4250 4260 4270 4280 4290 

DEF4 TGATCCTAAATATATATCTCGTAACAAGATGTCTTTGTTTACACCTCTtTGAAATTTGAT 

I Jit* t • a • • • • " • •••••• ••• •••• 

DEFX T CATC CCAAATAAATACTT GGTAA CAT GATTTCCGGGTTTTTTTTTTTTT 
4370 4380 4390 4400 4410 
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10 20 30 40 50 60 

DEF4 GTCTGCCCTCTCTGCTCGCCCTGCCTAGCTTGAGGATCTGTCACCCCAGCCATGAGGATT 

DEFX ctctgcccactctggtagcctcacgtagcttaacaatctgtgactacagttatgaggacc 

10 20 30 40 50 60 

70 80 90 100 110 120 

DEF4 atcgccctcctccctgctattctcttggtagccctccaggtccgggcaggcccactccac 
defx ctcaccctcctctctgcctttctcctggtggcccttcaggcctgggcagagccgctccag 

70 80 90 100 110 120 

130 140 150 160 170 180 

DEF4 gcaagaggtgatgaggctccaggccaggagcagcgtgggccagaagaccaggacatatct 
defx gcaagagctcatgagatgccagcccagaagcagcctccagcagatgaccaggatgtggtc 

130 140 150 160 170 180 

190 200 210 220 230 240 

DEF4 ATTTCCTTTGCATGGGATAAAAGCTCTGCTCTTCAGGTTTCAGGCTCAACAAGGGGCATG 



defx atttacttttcaggagatgacagctgctctcttcaggttccaggctcaacaaagggcttg 

190 200 210 220 230 240 

250 260 270 280 290 300 

DEF4 gtctgctcttgcagattagtattctgccggcgaacagaacttcgtgttgggaactgcctc 



defx atctgccattgcagagtactatactgcatttttggagaacatcttggtgggacctgcttc 

250 260 270 280 290 300 

310 320 330 340 350 360 

DEF4 ATTGGTGGTGTGAGTTTCACATACTGCTGCACGCGTGTCGATTAACGTTCTGCTGTCCAA 

DEFX ATCCTTGGTGAACGCTACCCAATCTGCTG CTACTAA 

310 320 330 340 350 

370 380 390 400 410 420 

DEF4 GAGAATGTCATGCTGGGAACGCCATCATCGGTGGTGTTAGCTTCACATGCTTCTGCAGCT 

DEFX 

360 370 380 390 

430 440 450 460 470 480 

DEF4 GAGCTTGCAGAATAGAGAAAAATGAGCTCATAATTTGCTTTGAGAGCTACAGGAAATGGT 



DEFX — GCTTGCAGACTAGAGAAAAA-GAGTTCATAATTTTCTTTGAGCATTAAAGGGAAT 

400 410 420 430 440 450 

490 500 510 520 530 

DEF4 TGTTTCTCCTATACTTTGTCCTTAACATCTT-TCTTGATCCTAAATATATATCTCGTAAC 

■ * I ! • S 2 I I I I * II I II I III* « • • I I I 

DEFX TGTTATTCTTATACCTTGTCCTCGATTTCCTGTCCTCATCCCAAATAAATACTTGGTAAC 
460 470 480 490 500 510 

540 
DEF4 AAG 

DEFX ATG 
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< Signal peptide >< - - 

5 10 15 20 

MetArgThrkeuThr LeuLeuSerAiaPhc LcuLeuValAlaLeu Gl nAlaTrpAlaGlu 



Propiece 

25 30 35 40 

ProLeuGlnAlaArg AlaHisGluMetPro AlaGlnLysGlnPro ProAlaAapAspGi n 



Propiece 

45 50 55 60 

AspValVallleTyr PheSerGlyAspAsp SerCysSerLeuGln Val ProGlySe rThr 



>< Mature peptide 

65 70 75 80 

LysGlyLeuIleCys HisCysArgValLeu TyrCysIlePheGly GluHisLeuGlyGly 



Mature peptide > 

85 90 94 

ThrCysPhelleLeu GlyGluArgTyr Pro IleCysCysTyr 



Figure 4 



SIGNAL 

DEF4_HUMAN MRI IALLAAI LLVALQVRA 

DEFS_HUMAN MRT I AI LAAI LLVALQAQA 

DEF6_HUMAN MRTLTILTAVLLVALQAKA 
DEF1_HUMAN MRT LAI LAAI LLVALQAQA 

DEFX MRTLTLLSAFLLVALQAWA 



PROPIECE 

GPLQAR GDEAPGQ- EQRG PEDQD ISIS FAWDKS S 

ESLQER ADEATTQ-KQSGEDNQDLAISFAGNGLS 

EP LQAEDDP LQAKAYEADAQ- EQRG AN DQDFAVS FAEDAS S 

EPLQAR- ADEVAAAPEQIAADIPEVWSLAWDESL 

EPLQAR AHEMPAQ-KQPPADDQDWIYFSGDDSC 

* * * * ... 



PROPIECE 
DEF 4 _HUMAN ALQVS G ST RGM 

DEF5_HUMAN ALRTSGSQARA 
DEF6~ HUMAN S LRALG ST RAF 

DEF1_HUMAH APKHPGSRKNM 
DEFX SLQVPGSTKGL 



Mature PEPTIDE 

VCSCRLVFCRRTELRVGNCLIGGVSFTYCCTRVD 

TCYCRTGRCATRESL5GVCEISGRLYRLCCR 

TCHCRR-SCYSTEYSYGTCTVMGINHRFCCL 

ACYCRI PACIAGERRYGTCIYQGRLWAFCC 

ICHCRVLYCIFGEHLGGTCFILGERYPICCY 

+ + * + * * ♦ ' * * + 

A A ' * ~ ~ A 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENE RALES : 

(i) DKPOSANT : 

(A) NOM: GENSET SA 

(H) RUE : 24 RUE ROYALE 

(C) VILLE: PARIS 

( £ ) PAYS: FRANCE 

fF) CODE POSTAL : 7 5008 

(ii) TITRE DE L 1 INVENTION: POLYPEPTIDE DEFENSINE HUMAINE Def-X, ADN 
GENOMIQUE ET ADNc, COMPOSITION LES . CONTENANT ET 
APPLICATIONS AU DIAGNOSTIC ET AU TRAITEMENT THERAPEUTIQUE 

(iii) NOMDRE DE SEQUENCES: 6 

(iv) FORME DECH I FFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D* EXPLOITATION: PC-DOS /MS-DOS 

(D) LOGICIEL: Patentln Release B1.0, Version HI. 30 (OEB) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 



(i) CARACTERI5TIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 4 15 PAIRES DE BASE 

(B) TYPE: NUCLEOTIDE 

(C) NOMBRE DE BR1NS: DOUBLE 

(D) CONFIGURATION: LINEAIRE 

(ii) TYPE DE MOLECULE: ADN 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 

( ix ) CARACTERISTIQUE : 

(A) NOM /CLE : Exon 1 

(B) EMPLACEMENT: 1836.. 1874 

(ix) CARACTERISTIQUE: . 

(A) NOM/CLE: Exon 2 

(B) EMPLACEMENT: 3394.-3577 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: Exon 3 

(B) EMPLACEMENT: 4161.. 4380 
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( ix ) CARACTERI STIQUE : 

(A) NOM/CLE: start CDS 

(B) EMPLACEMENT: 3406.. 3406 

( i>;) CARACTERI5TIQUE: 

(A) NOM/CLE: stop CDS 

{ B) EMPLACEMENT: 4 27 6. .4 278 

(ix) CARACTERI STIQUE : 

(A) NOM/CLE: site de polyAdenyla t ion 
(D) EMPLACEMENT: 4374.. 4379 



(xi) 


SEQUENCE DE 


SCRIPTION: 


SEQ ID NO: 








ACACCATTTG 


TCTTCATGTA 


ACCCCATTAG 


CTATACCCTC 


TAGTGCAAGG 


AAACCATAGG 


60 


GCCTAGGTCA 


CACCATGAGG 


CTGCNCTTAC 


AAGTTATGCA 


AAAACTATGG 


ACTTGGGAGA 


120 


CCTGTGCGTA 


ACAACATCAC 


ACNCCAAATT 


TAACCAGCTC 


TCCCCATAAC 


AGCACGCTCA 


180 


TGTGTTACTG 


AGGAAATGCC 


TGTGGATTGG 


AGTGTGTTCT 


GTGTGCAGGA 


GGCTGGTCCA 


240 


GGTTTCACTT 


CTGCAGGACA 


CTGGACGTTT 


CCCAAAACCA 


GCAGACTTTC 


CCCACGTGCA 


300 


CACACACCCC 


TTCTCATTTT 


GCCTCTACAT 


CCATATCCAC 


TGGGCCCTTC 


AGGCACCTAC 


360 


TAATGCCCTA 


GAACCTAAAA 


CCATCATCTG 


GGGCCCAGTT 


CCCTGAATGG 


CCCTAATCTC 


420 


TTCCTCTGCT 


GGAATGAGTC CAGTGCCCAC 


TTCCTCCAAC 


GGTGAAATTG 


CTGGGCTGCT 


4 Q0 


ACAGATCAGG 


AACTCACTGC 


TTCCTCATAG 


GGGCAGCCGA 


CTTCACTGCT 


CTGCAACAGC 


540 


GACCACCCCT 


AGCGAGGCTT 


GAGATGCCTC 


TTGCCTCCTT 


AAGACTGAGG 


GAGACGCTTC 


600 


AGCTCTCACT 


CCACTGCCCC 


AAGTCCTCCA 


CAGCGCGGTG 


CCTGCTGCCT 


TCACACAGAG 


660 


CTGCAGGGGN 


AGGTCCTGTG 


TATCCGGCCT 


GCTGGACCAG 


CGCTGTGCAC 


AACCCTCCCA 


720 


TGGCAACAGT 


GGCTGCCCGG 


CCTGCACACT 


GGGCTTGGCA 


ACCTCGCTGT 


AGGTATTTAT 


780 


TCCCTCAGGA 


GTGACTGCAT 


TCTTTTCCCA 


TTTCCAGAAA 


ACTGATGCCA 


TTTACCTCAC 


840 


TATGAGGAGG 


AGGAGGAGGA 


GGAGGGTGGA 


GAGTGGTACA 


TTTTAAAATG 


TGCACTATTC 


900 


TCCCTAGGAC 


TCCCCCTCAA 


ATAACCCAGG 


AGGGACCATA 


CCAGCTCATT 


CCTGTGTATC 


960 


CCAAGCATAN 


GAGTAATCAT 


CCCACTCATG 


CTGAGTGTAT 


GGTGGCCATT 


AAGCCTGCCC 


1020 


TGAACTGGCT 


TTAGAACAAG 


GTGTTTGAGC 


ACACAGCACC 


GTCTTGCTGC 


CACCTTGGCC 


1080 


CCCTCCCTTG 


TGAGACCTCT 


GAGACACATT 


NAGGTCTCAC 


CTAAAAATCT 


CAGGATTTCT 


1140 


AGGCCCAAAN 


1 CGGTCCTAAA AAATTGTTCA GTCTGAACTC 


: TCTAAGGTCA AGAGAAGAGG 


1200 
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TGCTTGCTCC CTCTAAGAAA CCACATGTTG CATGTACATC CTTAATTCCG GAAAGTCCAA 12 60 

CAAACCTGCC CTGCTTAGCA ACACAAGCCG AGGTGGTACT CCTCTCACCC GGGCATTCTC 1320 

CAACACACCT GTTTGTCCAA ACAGCTTTGA TTTGTTTTTA TAGTTGGACC CCAGGTTCCC 1380 

AGGAGGCTGG TTCAGGCCAT ATTCCAAATC CTCATCTGTG TGTGAGTGGC ATTCTTAGCC 14 40 

TAGCCTCCTT ACAGGGTGGA TACTATGATA CACAGCCAGG CTGTCCCAGT GGCTTTCAAT 1500 

ATTCTTTTGG TCCAGATAGT TCAGCCTCAG CACCAGTGTA GGCATCACAG GGTCAATTGT 15 GO 

CTTAGGAGTC ATGGAGAATT CATAGTTGGT AGCTACCTGG GCCTGGCCAG GGCTGACCA? 1620 

AGACAAGGCA TCCCTCTGTG AACTCCTATT TTAATGCCAG CTTCCCAACA AATTTCTCAA 168 0 

CTGCTCTTAC CAGCAGGTAT TTAAACTACT CAATAGAAAG TAACCCTGAA AATTAGGACA 17 4 0 

CCTGTTCCCA AAAGACCCTT AAATAGGGGA AGTCCTTTCN CTGCTTGTGC ACAGCTGCTG 18 00 

ATGTGGCAAC ATGAGGCCTG GGACAGGGGA CTGTCCTCTG CCCACTCTGG TAGCCTCACG 18 60 

TAGCTTAACA ATCTGTCAGT AATACAATAC AAAACTTAAA CTTTCATACT GCGGTTCCAC 1920 

CCAGGAAGCT GTGTTCCCAA TCTGACCCGT GATTATGGGG CCACCTGAGA GGGNACCCAG 1980 

TGAGGGAATA TTTTGCCATC TGGGACTGTT GGTTGCTGGG GGCAGTGGCT ATGAGCTCAG 2010 

TTAATAAACT CAAGCAGTTT CCTTCCAAAC ACACATGTCC TACTTAACGT GTCCAACAGA 2100 

GATGATCATA CTCATANGCT GCTAAAACAT TANTTTTATT TTGAGAAAAG TCTATTCATG 2160 

TTCTTGGCCC ATGGAGTTTT CATTTNATTA NTTTATTTAT TTTGCAGAGA TGGAGTCTCA 22 20 

CTATGTTGCT CAAGCTGGTC TCCAACTCCT GGGCTCAAGC GATCTTCCTA CTTTGGCCTT 22 8 0 

TGAAAGCGCT GAGATTGCCT GTGTGAGCCA TCATGGGGGC TCACTGGCCC ACTGATTAAT 234 0 

CAGATTAATT GTTTTTTGCT ATTGAANTTG TTTGACTTCC TTGTATATTC GGATATTTAC 24 00 

CCATTCTAAC ACGTAGGGTT TGCAAATATT TTCTCTCATG TTCTGTGTTG CCTTTTCACT 24 60 

CAGTTGATGG TTTCCTTTGC TGTGCAGGTG CTTTAGTGTT CAACGCAGCC CCGCTTGTCT 2 520 

ATTTTCCATT TTATTGCCTG TCCCTTTGAT GTCATAGCCA AGAAATAATT GCCCAGATTA 2 58 0 

ATGTCAAAAA GCTTTATCCC TATATATTCT TCTAGTAGTT TATGGTTTCA GATCTTATGT 264 0 

TTAGGTCTTC AATCCATTGA GTTGAT7TTT GTATGTGGTA TAAGAAAAAA GACCACATGT 27 0 

ATACATATCT CAAATTCTAA GGTAGTATAT ATT AG AC AC A TACAATGTGT CTATTTACAC 27 6 

ACATTGAGCT GAAAATAATA AACATATTTT TATCTTTCAA TCAACTCTAT CTCTATCTCA 28 2 
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CTGAACTTGT TTCACCTATA GCCTGATGAG GTTGCTGTCC TCTCTACCCC AGCTCCTATA 
GGAGACTGCT CATCCCCTAA CCTCAAAAAC CCCTTCATGA SGGTGATAAT GCCCTTGAAT 
CCTCCAATCA ATTAGTTCTC TACTACAGTG GAATTCAGGT CTGTTATGAG GGTCTCGATC 
TCTGAAGAGA ACAGCTCTCA TTTTCAGAAA ATAAGCAGGA TTTATTCCCT GAAATTACTG 
AATTAAATCA CTGTTTCGAT TACTTTTTGC AATATTAAAA GTAAATATTT AAACAGGTAA 
AAACAGAAAT AATGGTAGGG TCCTTATCAT CACCGTGAAT TCCAAGCTAG CATAGACACT 
AAACCTAGAG ATTCACACTA GAATGAAAGC TGGGAGAGCA GAGGAGTCTC AGAAGGATGT 
GGAGGCCAAT GGACACCTGC AACCTCTCCA ACGAAATGCC TACCTCCTCT CACTGCAGCA 
TCCATCTCTG AGCCTTCTCG CAGCAGAGCT ATAAATTCAG CCTGGCTCCT CCGTTCCCAC 
ACATCCACTC CTGCTCTCCC TCCTCTCCTC CAGGTGACTA CAGTTATGAG GACCCTCACC 
CTCCTCTCTG CCTTTCTCCT GGTGGCCCTT CAGGCCTGGG CAGAGCCGCT CCAGGCAAGA 
GCTCATGAGA TGCCAGCCCA GAAGCAGCCT CCAGCAGATG ACCAGGATGT GGTCATTTAC 
TTTTCAGGAG ATGACAGCTG CTCTCTTCAG GTTCCAGGTG AGAGATGCCA GCATGCAGAG 
CTACAGACTA GACAGAAGGA CAGGAGACAG GCTCTGGAAT TGGATCTCAG TGGCAGATGT 
CACTTAGGTG GCTATACTTA ACATCTCTGG TCCTGGATTT TCTCATATCT AAATGGAATA 
GAGAACCAAA GAAATCTAAG AGATTTTTCT TTCTCCAAAA ACTTGATTCC AAGATATGAC 
TGTGAAATTC ACTAGATTTA AGATATAAGG AGATGCTACC TAGTTCCTTC TGGAGCCAGA 
CAAACAAGCT TAAGTATATA GGAAAATATT TCACCCTGTC TATATAGGAG GTTTTAGAAC 
CTGGAGAGGA GCCTAAGAAT GTGTTCAGGT GTGTGTGTGA TGGGCAGGAA TGCAGAAAAG 
TGAAGCAAAG GAGAATGAGT CTCGAATCCT GTGTGACCAG CACTGCTCTG TGTATTTATT 
CCTATTGACT GAGATTGTTT GTGCTACCGG CTGTAATACA GCCAACATCA CTCATCAGCC 
AACATGTGAC TTCTCCAAGA TTCCCTTTAC CACCCACTGC TGNACCCCGT ACTCAGTTTC 
TGATGCTCTC TCTGGGTCCC CAGGCTCAAC AAAGGGCTTG ATCTGCCATT GCAGAGTACT 
ATACTGCATT TTTGGAGAAC ATCTTGGTGG GACCTGCTTC ATCCTTGGTG AACGCTACCC 
AATCTGCTGC TACTAAGCTT GCAGACTAGA GAAAAAGAGT TCATAATTTT CTTTGAGCAT 
TAAAGGGAAT TGTTATTCTT ATACCTTGTC CTCGATTTCC TGTCCTCATC CCAAATAAAT 
ACTTGGTAAC ATGATTTCCG GGTTTTTTTT TTTTT 
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(2) INFORMATIONS POUR IA SEQ ID NO: 2: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

{A) LONGUEUR: 453 PAIRE3 DE BASE 

\ D) TYPE: NUCLEOTIDE 

(C) NOMBRE DE BRINS: DOUBLE 

(D) CONFIGURATION: LINEAIRE 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2: 



CTCTGCCCAC TCTGGTAGCC TCACGTAGCT TAACAATCTG TGACTACAGT T ATG AGG 57 

Met Arg 
1 

ACC CTC ACC CTC CTC TCT GCC TTT CTC CTG GTG GCC CTT CAG GCC TGG 105 
Thr Leu Thr Leu Leu Ser Ala Phe Leu Leu Val Ala Leu Gin Ala Trp 
5 10 15 

GCA GAG CCG CTC CAG GCA AGA GCT CAT GAG ATG CCA GCC CAG AAG CAG 153 
Ala Glu Pro Leu Gin Ala Arg Ala His Glu Met Pro Ala Gin Lys Gin 
20 25 30 

CCT CCA GCA GAT GAC CAG GAT GTG GTC ATT TAC TTT TCA GGA GAT GAC 201 
Pro Pro Ala Asp Asp Gin Asp Val Val lie Tyr Phe Scr Gly Asp Asp 
35 40 45 50 

AGC TGC TCT CTT CAG GTT CCA GGC TCA ACA AAG GGC TTG ATC TGC CAT 24 9 

Ser Cys Ser Leu Gin Val Pro Gly Ser Thr Lys Gly Leu lie Cys His 
55 60 " " 65 

TGC AGA GTA CTA TAC TGC ATT TTT GGA GAA CAT CTT GGT GGG ACC TGC 297 
Cys Arg Val Leu Tyr Cys lie Phe Gly Glu His Leu Gly Gly Thr Cys 
70 75 80 

TTC ATC CTT GGT GAA CGC TAC CCA ATC TGC TGC TAC TAA GCTTGCAGAC 34 6 

Phe lie Leu Gly Glu Arg Tyr Pro lie Cys Cys Tyr * 
85 90 95 

TAGAGAAAAA GAGTTCATAA TTTTCTTTGA GCATTAAAGG GAATTGTTAT TCTTATACCT 4 06 



TGTCCTCGAT TTCCTGTCCT CATCCCAAAT AAATACTTGG TAACATG 



453 
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(2) INFORMATIONS POUR LA SEQ ID NO : 3: 

(i) CARACTERI ST IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 94 ACIDES AMINES 

(D) TYPE: AC IDE AMINE 

(C) NOMBRE DE BRINS: SIMPLE 

(D) CONFIGURATION: LINEAIRE 

(ii) TYPE DE MOLECULE: PROTEINE 

(vi) ORIGINS: 

(A) ORGAN1SME: Homo sapiens 

(ix) CARACTERI STIQUE : 

(A) NOM/CLE: PEPTIDE SIGNAL 

(B) EMPLACEMENT: 1..19 

(ix) CARACTERI STIQUE : 

(A) NOM/CLE: REGION PRO 

(B) EMPLACEMENT: 20.. 63 

{ ix ) CARACTERI STIQUE : 

(A) NOM/CLE: PEPTIDE MATURE 

(B) EMPLACEMENT: 64 . . 94 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3: 



Met Arg Thr Leu 
1 

Ala Trp Ala Glu 
20 



Lys Gin Pro Pro 
35 



Asp Asp Ser Cys 
50 

Cys His Cys Arg 
65 

Thr Cys Phe lie 



Thr Leu Leu Ser 
5 

Pro Leu Gin Ala 



Ala Asp Asp Gin 
40 

Ser Leu Gin Val 
55 



Val Leu Tyr Cys 
70 

Leu Gly Glu Arg 
85 



Ala Phe Leu Leu 
10 

Arg Ala His Glu 
25 

Asp Val Val He 



Pro Gly Ser Thr 
60 

He Phe Gly Glu 
75 

Tyr Pro He Cys 
90 



Val Ala Leu Gin 
15 

Met Pro Ala Gin 
30 

Tyr Phe Ser Gly 
45 

Lys Gly Leu He 



His Leu Gly Gly 
80 

Cys Tyr 
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(2) INFORMATIONS POUR IA SEQ ID NO: 4: 

(i) CARACTERISTIQUE5 DE LA SEQUENCE: 

(A) LONGUEUR: 19 ACIDES AMINES 

(B) TYPE: ACIDE AMINE 

(C) NOMDRE DE BRINS: SIMPLE 

(D) CONFIGURATION : LINEAIRE 

(ii.J TYPE DE MOLECULE: PEPTIDE SIGNAL 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4: 

Met Arcj Thr Leu Thr Leu Leu Ser Ala Phe Leu Leu Val Ala Leu Gin 
1 5 10 IS 

Ala Trp Ala 



(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: A 4 ACIDES AMINES 

(B) TYPE: ACIDE AMINE 

(C) NOMBRE DE BRINS: SIMPLE 

(D) CONFIGURATION : LINEAIRE 

(ii) TYPE DE MOLECULE: REGION PRO 

(vi) ORIGINE: 

(A) ORGANISME: Homo sapiens 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5: 

Glu Pro Leu Gin Ala Arg Ala His Glu Met Pro Ala Gin Lys Gin Pro 
15 10 15 

Pro Ala Asp Asp Gin Asp Val Val lie Tyr Phe Ser Gly Asp Asp Ser 
20 25 30 



Cys Ser Leu Gin Val Pro Gly Ser Thr Lys Gly Leu 
35 40 
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(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 ACIDES AMINES 

(B) TYPE: AC IDE AMINE 

(C) NOMDRE DE BRING : SIMPLE 

(D) CONFIGURATION: LINEAIRE 

(ii) TYPE DE MOLECULE: PEPTIDE MATURE 

(vi) OIUGINE: 

(A) ORGANISMS: Homo sapiens 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6; 



lie Cys His Cys Arg Val Leu Tyr Cys lie Phe Gly Glu His Leu Gly 

I 5 10 15 

Gly Thr Cys Phe lie Leu Gly Glu Arg Tyr Pro He Cys Cys Tyr 
20 25 30 
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